LLMは、大量の文章から言葉のパターンを学び、入力に続く自然な文章を生成できる大規模言語モデル。
ChatGPTやClaudeなど、会話形式の生成AIを支える中心的な仕組みです。
LLMは、言葉を扱う生成AIの中核モデル
LLMは「Large Language Model(大規模言語モデル)」の略です。大量の文章を学習し、言葉同士のつながりや文章の型を数値的なパターンとして持っています。
生成AIは文章・画像・音声などを作るAI全体を指す言葉です。その中でLLMは、文章の理解と生成を中心に担当します。ChatGPTやClaudeはAIツールの名前であり、LLMはその裏側で言葉を処理するモデルです。
文章・画像・音声など、新しい出力を作るAI全体の呼び方。
言葉のパターンを学び、文章を理解・生成するモデル。
チャット画面などを通して、利用者がLLMを使えるようにする。
文章は「次に続きそうな言葉」を重ねて作る
LLMは質問への答えをデータベースからそのまま取り出しているわけではありません。入力された文章と、それまでに生成した文章を手がかりに、次に続きそうな言葉の候補を計算し、少しずつ文章を組み立てます。
この繰り返しによって、質問への回答、要約、翻訳、コードなどを生成できます。学習したパターンをもとに文章を作るため、自然な回答が得意な一方、事実と異なる内容をもっともらしく生成することもあります。
LLMが文章を処理するときは、文字列をそのまま読むのではなく、トークンという細かな単位へ分けます。トークン数は入力できる文章量やAPI料金にも関係します。
LLMごとに得意なことや特徴が異なる
LLMはひとつだけではありません。ChatGPT、Claude、GeminiなどのAIサービスでは、それぞれ異なる種類や特徴を持つLLMが使われています。モデルごとに、複雑な依頼への対応力、回答の速さ、扱える文章量、画像や音声を扱えるかなどに違いがあります。
複雑な質問、長い文章、コードなどへの対応力が異なる。
回答速度や、一定期間に利用できる量などが異なる。
長い文章、画像、音声など、扱える内容や量が異なる。
そのため、同じ質問でも、使うAIツールやモデルによって回答が変わります。ただし、どのLLMも学習した言葉のパターンをもとに文章を生成するため、自然な回答が必ず正しいとは限りません。
ここまでのまとめ
LLMは、大量の文章から言葉のつながりを学び、次に続きそうな言葉を重ねて文章を生成するモデルです。会話しているように見えても、人と同じ方法で意味や事実を理解しているわけではありません。
LLMは、言葉の続きを高い精度で予測しながら、文章を少しずつ組み立てるモデルです。