【経産省ガイドライン準拠】LLMとは|生成AIとの違いと仕組みを図解

Check!

  • LLM=大規模言語モデル。大量テキストで学習し言語タスクを実行する
  • 「生成AI ⊃ LLM」の包含関係(LLMはテキスト生成を担う)
  • 業務利用の3リスク:ハルシネーション/情報漏洩/著作権

「LLMと生成AIは何が違うのか」「ChatGPTを使っているが、裏で何が起きているのか分からない」──そんな疑問を抱える担当者は少なくないはずです。経済産業省・総務省「AI事業者ガイドライン(第1.2版)」や総務省「令和7年版 情報通信白書」では、生成AIや大規模言語モデル(LLM)が業務・社会に与える影響と、利用時に押さえるべきリスクが整理されています。本記事では、LLMの定義から生成AIとの包含関係、トークン化と確率予測の仕組み、業務利用時の3つのリスクまでを、3層ペルソナ(個人事業主/中小/中堅大企業)に向けて公的資料ベースで体系的に解説します。AIの基礎全般については別記事『【経産省ガイドライン準拠】AIとは|中小企業が知るべき基礎と安全な始め方』もあわせてご覧ください。

目次

開く

閉じる

  1. LLM(大規模言語モデル)とは|定義と特徴
  2. 生成AIとLLMの関係|「生成AI⊃LLM」の包含関係
  3. LLMの仕組み|トークン化と確率予測の流れ
  4. 業務でLLMを使う際の3つのリスク
  5. よくある質問(FAQ)
  6. まとめ|今日からできる3つのこと
  7. 関連記事
  8. 参考文献

LLM(大規模言語モデル)とは|定義と特徴

LLM(Large Language Model)は、日本語で「大規模言語モデル」と訳されるAIの一種で、膨大なテキストデータから言語のパターンを学習し、自然言語による生成・翻訳・要約・質問応答などのタスクを実行できるディープラーニングモデルです。ChatGPT・Claude・Geminiといった対話型AIサービスの中核技術として広く知られるようになりました。

図1:LLMの3段プロセス|学習データから言語タスクへ ①大量のテキストデータ Web上の文章 書籍・論文 プログラムコード 数十億〜数兆トークン ②ディープラーニング学習 Transformerアーキテクチャ ③言語タスクを実行 文章生成・要約 翻訳・質問応答 コード生成 対話型AIの基盤に 出典:経済産業省・総務省「AI事業者ガイドライン(第1.2版)」(2026年3月)/総務省「令和7年版 情報通信白書」を参考に編集部作成
図1:LLMの基本構造

「大規模」の意味|データ量・計算量・パラメータ数

LLMが従来の言語モデルと違うのは、①学習データ量、②計算量、③パラメータ数(モデル内部の重み)が大きく増えた点です。総務省「令和7年版 情報通信白書」では、2020年以降「スケーリング則」(規模を大きくするほど性能が向上する経験則)に従ったモデルの大規模化が進み、AI領域全体が爆発的に進展していると整理されています。この規模拡大によって、要約・翻訳・質問応答といった複数のタスクを1つのモデルで高い精度で扱えるようになりました。

代表的なLLM|GPT・Claude・Gemini等

ビジネスの現場で目にする代表的なLLMには、OpenAI社のGPTシリーズ、Anthropic社のClaude、Google社のGeminiなどがあります。いずれもクラウド経由でAPIまたはチャット形式で利用でき、業務利用ではセキュリティ要件や用途に応じて使い分けが行われています。本記事は特定製品の優劣を評価するものではなく、技術としてのLLMの共通的な特徴に焦点を当てます。

生成AIとLLMの関係|「生成AI⊃LLM」の包含関係

生成AIとLLMは、しばしば同じ意味で使われますが、正確には「包含関係」にあります。生成AIは画像・音声・動画なども含む広い概念で、その中の「テキスト生成」を担う技術がLLMです。「LLM=ChatGPT」ではなく、ChatGPTの裏側にあるテキスト生成エンジン(GPT等)がLLMにあたると整理すると理解しやすくなります。

図2:生成AI ⊃ LLM|包含関係と従来AIとの違い 従来のAI (識別・予測中心) 画像認識(猫/犬の判別) 需要予測・異常検知 スパム判定・与信判定 → 入力を「分類・予測」 → 出力は限られた選択肢 生成AI Generative AI LLM 大規模言語モデル (テキスト生成) 画像生成 音声生成 動画生成 → 新しいコンテンツを「生成」 → 出力は自由テキスト・画像等 出典:経済産業省・総務省「AI事業者ガイドライン(第1.2版)」(2026年3月)/総務省「令和7年版 情報通信白書」を参考に編集部作成
図2:生成AIとLLMの包含関係(生成AI⊃LLM)と従来AIとの違い

従来のAIとの違い|「分類・予測」から「生成」へ

従来のAIは、入力に対して「猫か犬か」「異常か正常か」といった限られた選択肢から答えを返す「識別・分類・予測」を得意としてきました。これに対しLLMを含む生成AIは、入力されたプロンプト(指示文)から自由なテキスト・画像・音声などを新たに作り出す点が大きな違いです。総務省「令和7年版 情報通信白書」でも、2022年以降のLLMの実用化が「AIの爆発的進展」と表現されています。

「LLM≠生成AI」を意識する実務上の意味

業務でAIサービスを選定する際、「生成AIを導入する」と一言で表現してしまうと、テキスト生成(LLM)・画像生成・音声生成のどれを意味するかが曖昧になります。検討時には「テキスト生成(LLM)/画像生成/音声生成のうち、どれを業務のどの工程で使うのか」を明示することで、求める機能・コスト・リスクの議論がしやすくなります。生成AIの用途全般や代表例については、別記事『生成AIとは|種類・できること・代表例をわかりやすく解説』もご参照ください。

LLMの仕組み|トークン化と確率予測の流れ

LLMの中身は「次に来る単語(正確にはトークン)を確率的に予測し続けるエンジン」と整理できます。入力されたテキストを小さな単位に分割し、数値化し、過去の学習パターンから「次に来る確率が最も高いもの」を選び続けることで、自然な文章を生成します。

図3:LLMの処理フロー|入力から出力までの5ステップ 1 入力テキスト 「明日の天気は」 ユーザーの入力 2 トークン分割 「明日」「の」 「天気」「は」 最小単位に分解 3 ベクトル化 [0.12, 0.87, −0.43, …] 数値表現に変換 4 次トークン確率予測 「晴れ」74% 「雨」18% 「曇り」6% … 5 出力テキスト 「明日の天気は晴れです」 予測したトークンを入力に加えて次を予測(繰り返し) 出典:総務省「令和7年版 情報通信白書」第Ⅰ部第1章第2節を参考に編集部作成
図3:LLMの処理フロー(入力→トークン化→ベクトル化→次トークン確率予測→出力)

トークンとは|文字でも単語でもない「言語の最小単位」

LLMは文章を「トークン」と呼ばれる単位に分けて扱います。日本語では1文字=1トークンに近い場合もあれば、複数文字がまとめて1トークンになる場合もあります。たとえば「明日の天気は」という文は、4〜5個程度のトークンに分割されるイメージです。LLMの利用料金や処理速度がトークン数で課金・計測されることが多いため、業務利用ではトークン数を意識した設計が重要になります。

確率予測の本質|「考えている」のではなく「次に来る確率」を計算している

LLMは人間のように「意味を理解して回答を考えている」のではなく、学習データから得たパターンに基づいて「次に来る確率が高いトークン」を選び続けていると整理できます。この仕組みを理解しておくと、LLMが事実と異なる内容をもっともらしく出力する「ハルシネーション」が起きる理由も腑に落ちやすくなります。LLMから望ましい出力を得るための指示の出し方は、別記事『AIプロンプトとは|業務での書き方と注意点』で解説しています。

業務でLLMを使う際の3つのリスク

LLMを業務に取り入れる際、便利さの裏側にある「リスク」を理解しないまま使うと、誤情報の公開や情報漏洩などのトラブルにつながります。経済産業省・総務省「AI事業者ガイドライン(第1.2版)」では、AI利用者が留意すべき複数のリスクが整理されています。ここでは特に業務利用で顕在化しやすい3つを取り上げます。

図4:LLM業務利用の3リスクと対応の方向性 ①ハルシネーション 事実と異なる内容を もっともらしく出力 対応の方向 ・人による事実確認の必須化 ・複数情報源との照合 ・出力単独で最終判断しない 業種を問わず最も顕在化 しやすいリスク ②情報漏洩 入力情報がモデル学習や 外部送信に使われる懸念 対応の方向 ・利用規約・データ取扱の確認 ・法人向けプランの選択 ・社内ルール・教育の整備 情報通信白書の懸念事項で 上位に位置 ③著作権・権利侵害 生成物が第三者の著作物 に類似する懸念 対応の方向 ・公開前の類似性チェック ・引用元の明示 ・社内ガイドラインの策定 生成物の権利関係は 業務利用で必ず確認 出典:経済産業省・総務省「AI事業者ガイドライン(第1.2版)」(2026年3月)/総務省「令和7年版 情報通信白書」を参考に編集部作成
図4:LLM業務利用の3リスク(ハルシネーション/情報漏洩/著作権)

ハルシネーション|「もっともらしい誤情報」への対応

LLMは確率に基づいて文章を生成するため、学習データにない情報や曖昧な質問に対して、もっともらしい誤った内容を返すことがあります。AI事業者ガイドラインでは、AIの出力を最終的な意思決定にそのまま用いず、人間の判断を介在させる「人間中心」の考え方が示されています。業務での活用では、出力内容を一次資料や複数情報源と照合し、責任の所在を明確にしたうえで使うことが基本です。

情報漏洩|入力データの取扱を必ず確認する

総務省「令和7年版 情報通信白書」では、企業が生成AI導入に際して挙げる懸念の上位に「社内情報の漏えい等のセキュリティリスク」が含まれることが示されています。サービスごとに「入力したデータをモデル学習に使うかどうか」が異なるため、業務利用前には利用規約・データ取扱方針を確認し、必要に応じて法人向けプラン(入力データを学習に使わない設定)を選ぶことが現実的な対応です。

著作権・権利侵害|公開前の類似性チェックを習慣化

LLMが生成した文章や、画像生成AIが作った画像が、既存の著作物に類似してしまうケースもあります。AI事業者ガイドラインに沿って、生成物を社外に公開する前に類似性を確認し、引用元が明確な場合は出典を明示する運用が望まれます。ガイドラインの全体像と業務での留意点は、別記事『AI事業者ガイドラインとは|概要と業務での活用ポイント』もあわせてご確認ください。

よくある質問(FAQ)

Q1. LLMと生成AIはどう違うのですか?

A. 生成AIはテキスト・画像・音声・動画など「新しいコンテンツを生成するAI」の総称で、LLMはその中でも「テキスト生成」を担う技術です。「生成AI ⊃ LLM」という包含関係で整理すると分かりやすくなります。

Q2. ChatGPTとLLMは同じものですか?

A. 厳密には異なります。ChatGPTはOpenAI社が提供する対話型サービスの名称で、その裏側でテキスト生成を担っているのがGPTシリーズというLLMです。サービス(ChatGPT)と、その内部の技術(LLM)を分けて理解すると、他社サービスとの比較もしやすくなります。

Q3. LLMは人間のように「考えて」いるのですか?

A. 人間と同じ意味で「考えて」いるわけではありません。学習データから得たパターンに基づき、次に来る確率が高いトークンを選び続けることで自然な文章を生成しています。この点を理解しておくことが、ハルシネーション等のリスクを正しく評価する出発点になります。

Q4. 業務でLLMを使うとき、まず何を確認すべきですか?

A. ①利用するサービスのデータ取扱方針(入力情報が学習に使われるか)、②社内で扱える情報の範囲、③出力の事実確認体制、の3点を最初に整理することが現実的です。AI事業者ガイドライン(第1.2版)の「AI利用者」向け項目を業務に合わせて参照することが推奨されます。

Q5. LLMの料金はどう計算されるのですか?

A. 多くのLLMサービスでは、入力と出力のトークン数に応じて課金されます。長い文章を扱うほどコストが上がるため、業務利用では「プロンプトを簡潔にする」「不要なやり取りを減らす」といった設計が運用コストに直結します。具体的な料金は各サービスの公式情報で最新値を確認してください。

Q6. 中小企業や個人事業主でもLLMを業務に使えますか?

A. 使えます。月額数千円程度から利用できる法人向け・個人向けプランも整備されており、文書作成・要約・翻訳・問い合わせ対応の下書きなど、特定業務に絞った活用から段階的に広げていくことが現実的です。導入前に、社内で扱える情報の範囲と出力の確認手順をルール化しておくと運用が安定します。

まとめ|今日からできる3つのこと

  1. 「生成AI ⊃ LLM」の包含関係を社内で共有する──サービス選定・社内説明の前提として、テキスト生成(LLM)・画像生成・音声生成のどれを使うかを明示する習慣をつけます。
  2. LLMの出力を「下書き」として扱うルールを決める──ハルシネーション対策として、対外公開・意思決定前に必ず人による事実確認を挟む運用を社内ルール化します。
  3. 利用するサービスのデータ取扱方針を確認する──入力データがモデル学習に使われるかどうかを契約・利用規約で確認し、必要に応じて法人向けプランを選択します。

関連記事

参考文献

同じカテゴリの記事を探す

同じタグの記事を探す

同じタグの記事はありません

top