基礎知識編3：大規模言語モデル（LLM）の基礎 - 生成AI時代のSEO（AEO、GEO、LLMO） by スキルアップカレッジ

はじめに：回答を「生成」するエンジンの心臓部

前回の記事では、検索が「リンクのリスト」から「直接的な回答」へとシフトしている「回答エンジン」の時代について解説しました。この革命的な変化を支えている中核技術が、大規模言語モデル（Large Language Model、以下LLM）です。

ChatGPT、GoogleのGemini（旧Bard）、Claudeなど、私たちが日常的に触れるようになった生成AIサービスの多くは、このLLMを基盤としています。検索エンジンの未来を考える上で、LLMがどのようにして文章を生成しているのか、その基本的な仕組みを理解することは不可欠です。

本記事では、この複雑に見えるLLMの仕組みを可能な限り平易に解説し、その能力と限界、そして検索に与える影響について理解を深めます。

1. 大規模言語モデル（LLM）とは何か？

LLMとは、その名の通り「大規模（Large）」な「言語モデル（Language Model）」です。分解して考えてみましょう。

言語モデル（Language Model）
これは、一言で言えば「次に来る単語を予測するプログラム」です。スマートフォンのキーボードで文字を入力していると、次に打ちたい単語の候補が表示される機能がありますが、言語モデルはその非常に高度なバージョンとイメージすると分かりやすいでしょう。
例えば、「日本の首都は」という文章が与えられたら、次に「東京」という単語が来る確率が最も高い、と予測するのが言語モデルの役割です。
大規模（Large）
何が「大規模」かというと、主に2つの要素があります。

学習データの規模：インターネット上の膨大なテキストデータ（ウェブサイト、書籍、論文など、数十億から数兆語）を読み込んで学習している。
モデルの規模：モデルの賢さを決める「パラメータ」と呼ばれる調整可能な要素が、数億から数兆個という天文学的な数にのぼる。

つまりLLMとは、「インターネット規模の膨大な知識を学習し、人間が書くような自然な文章の次に来る単語を、極めて高い精度で予測できる巨大なプログラム」と言えます。

2. LLMはどのようにしてテキストを生成するのか？

LLMが魔法のように文章を作り出すプロセスは、「トレーニング（学習）」と「推論（生成）」の2つのフェーズに分かれています。

フェーズ1：トレーニング（学習）

LLMは、開発段階で膨大な量のテキストデータをひたすら読み込みます。この過程で、特定の単語の次にはどの単語が来やすいか、という統計的なパターンを学習します。

例えば、ウェブ上の文章を大量に学習することで、

「明けまして」の後には「おめでとうございます」が来やすい
「主語」の後には「述語」が来るという文法ルール
「E=mc²」がアインシュタインの有名な数式であるという事実関係
丁寧な文章や、くだけた文章のトーン＆マナー

といった、言語に関するあらゆるパターンを、パラメータという形でモデル内部に蓄積していきます。この学習には、高性能なコンピュータを駆使しても数週間から数ヶ月という長い時間が必要です。

フェーズ2：推論（テキスト生成）

ユーザーがプロンプト（指示文）を入力すると、学習済みのLLMがテキストの生成を開始します。

プロンプトの理解：まず、入力されたプロンプトを単語やトークンと呼ばれる単位に分解します。
次の単語の予測：モデルは、プロンプトの文脈に続いて出現する確率が最も高い単語を予測します。

例：プロンプトが「生成AIとは、」の場合、モデルは学習した知識から「人工知能の一種であり」や「テキストや画像を」といった候補を考え、最も自然な続きを選択します。

予測の連鎖：次に、生成した単語を含めた文章全体（例：「生成AIとは、人工知能の一種であり」）を新たな文脈として、さらにその次の単語を予測します。
生成の完了：このプロセスを単語ごとに繰り返し、文章の終わりを示す特別な記号を生成するか、指定された文字数に達するまで続けます。

この一連の予測を高速で繰り返すことで、人間が読んでも自然で、かつ論理的な文章が生成されるのです。この高度な文脈理解を可能にしているのが「Transformer（トランスフォーマー）」と呼ばれるアーキテクチャであり、特に「Attention（アテンション）機構」という仕組みが、文章中のどの単語に注目すべきかを判断する上で重要な役割を果たしています。

3. LLMの能力と限界

LLMは万能ではありません。その仕組みに由来する限界を理解することは、SEO担当者にとって非常に重要です。

LLMの主な能力

文章の生成・要約：ブログ記事の作成、メールの文面作成、長文の要約など。
翻訳：多言語間の翻訳。
質疑応答：質問に対して自然な文章で回答。
コード生成：簡単なプログラムコードの記述。

LLMの限界：「ハルシネーション（幻覚）」

LLMは、人間のように物事を「理解」しているわけではなく、あくまで学習データに基づいた統計的な確率で「それらしい」単語を予測しているに過ぎません。そのため、事実と異なる情報を、あたかも真実であるかのように生成してしまうことがあります。これを「ハルシネーション（Hallucination：幻覚）」と呼びます。

例えば、存在しない人物の経歴や、起こっていない事件の詳細をもっともらしく語ってしまうケースが報告されています。これは、LLMが「正解を知らない」ということを認識できず、確率的に最も繋がりやすい単語を紡ぎ続けてしまうために起こります。

参考事例: 法律の専門家がChatGPTに過去の判例をリサーチさせたところ、存在しない架空の判例を複数引用されたという事例が実際に報告されています。これは、LLMが生成した情報のファクトチェックがいかに重要かを示す教訓です。

参考URL: A lawyer used ChatGPT to prepare a court filing. It went horribly wrong. – CBS News

4. LLMが検索（SEO）に与える影響

LLMの登場は、検索とSEOに以下のような構造的な影響を与えます。

検索結果での直接回答
Google SGEのように、検索結果ページでLLMが生成した回答が提示されることで、ユーザーがウェブサイトを訪問する必要性が低下します。SEOの目標は、クリック獲得だけでなく、このAI生成回答の「情報源」として引用されることへとシフトします。
情報検索チャネルの多様化
ユーザーはGoogle検索だけでなく、ChatGPTなどのチャットサービスを使って情報を探すようになります。これらのLLMの学習データに自社の情報やブランドが含まれていなければ、ユーザーに発見される機会を失うことになります。
学習データの「ブラックボックス」問題
OpenAIのGPTシリーズなど、主要なLLMが何を学習したかの詳細は公開されていません。一般的には「Common Crawl」のような公開されたWebクロールデータや書籍などが使われているとされますが、その全容は不明です。そのため、「このLLMに学習させる」ことを目指した直接的な最適化は困難です。

しかし、Bing ChatやPerplexity、ChatGPTのブラウジング機能のように、リアルタイムでWeb検索を行い、その結果を基に回答を生成するLLMも増えています。この場合、従来のBing検索やGoogle検索の順位が、間接的にLLMの回答に影響を与えることになります。結局のところ、検索エンジンに高く評価される質の高いコンテンツを作ることが、巡り巡ってLLMに参照されるための近道となるのです。

5. まとめ：予測マシンとしてのLLMを理解する

本記事では、LLMが「次に来る単語を予測する」というシンプルな原理に基づいていること、そしてその能力と限界について解説しました。

LLMは、膨大なテキストデータから言語のパターンを学習した、巨大な単語予測プログラムである。
確率に基づいてテキストを生成するため、ハルシネーション（事実誤認）を起こすリスクがある。
検索においては、直接回答を生成することでユーザー行動を変え、SEOの目標を「引用される情報源」へとシフトさせる。

この「確率的な予測マシン」というLLMの本質を理解することは、今後のSEO戦略を立てる上での基礎となります。

次回、「基礎知識編4」では、このLLMを搭載した「回答エンジン」に対して、具体的にどのようにコンテンツを最適化していくべきか、「Answer Engine Optimization (AEO)の基礎」について詳しく解説します。