【経産省ガイドライン準拠】LLMとは|生成AIとの違いと仕組みを図解
Check!
- LLM=大規模言語モデル。大量テキストで学習し言語タスクを実行する
- 「生成AI ⊃ LLM」の包含関係(LLMはテキスト生成を担う)
- 業務利用の3リスク:ハルシネーション/情報漏洩/著作権
「LLMと生成AIは何が違うのか」「ChatGPTを使っているが、裏で何が起きているのか分からない」──そんな疑問を抱える担当者は少なくないはずです。経済産業省・総務省「AI事業者ガイドライン(第1.2版)」や総務省「令和7年版 情報通信白書」では、生成AIや大規模言語モデル(LLM)が業務・社会に与える影響と、利用時に押さえるべきリスクが整理されています。本記事では、LLMの定義から生成AIとの包含関係、トークン化と確率予測の仕組み、業務利用時の3つのリスクまでを、3層ペルソナ(個人事業主/中小/中堅大企業)に向けて公的資料ベースで体系的に解説します。AIの基礎全般については別記事『【経産省ガイドライン準拠】AIとは|中小企業が知るべき基礎と安全な始め方』もあわせてご覧ください。
おすすめ記事
目次
開く
閉じる
開く
閉じる
LLM(大規模言語モデル)とは|定義と特徴
LLM(Large Language Model)は、日本語で「大規模言語モデル」と訳されるAIの一種で、膨大なテキストデータから言語のパターンを学習し、自然言語による生成・翻訳・要約・質問応答などのタスクを実行できるディープラーニングモデルです。ChatGPT・Claude・Geminiといった対話型AIサービスの中核技術として広く知られるようになりました。
「大規模」の意味|データ量・計算量・パラメータ数
LLMが従来の言語モデルと違うのは、①学習データ量、②計算量、③パラメータ数(モデル内部の重み)が大きく増えた点です。総務省「令和7年版 情報通信白書」では、2020年以降「スケーリング則」(規模を大きくするほど性能が向上する経験則)に従ったモデルの大規模化が進み、AI領域全体が爆発的に進展していると整理されています。この規模拡大によって、要約・翻訳・質問応答といった複数のタスクを1つのモデルで高い精度で扱えるようになりました。
代表的なLLM|GPT・Claude・Gemini等
ビジネスの現場で目にする代表的なLLMには、OpenAI社のGPTシリーズ、Anthropic社のClaude、Google社のGeminiなどがあります。いずれもクラウド経由でAPIまたはチャット形式で利用でき、業務利用ではセキュリティ要件や用途に応じて使い分けが行われています。本記事は特定製品の優劣を評価するものではなく、技術としてのLLMの共通的な特徴に焦点を当てます。
生成AIとLLMの関係|「生成AI⊃LLM」の包含関係
生成AIとLLMは、しばしば同じ意味で使われますが、正確には「包含関係」にあります。生成AIは画像・音声・動画なども含む広い概念で、その中の「テキスト生成」を担う技術がLLMです。「LLM=ChatGPT」ではなく、ChatGPTの裏側にあるテキスト生成エンジン(GPT等)がLLMにあたると整理すると理解しやすくなります。
従来のAIとの違い|「分類・予測」から「生成」へ
従来のAIは、入力に対して「猫か犬か」「異常か正常か」といった限られた選択肢から答えを返す「識別・分類・予測」を得意としてきました。これに対しLLMを含む生成AIは、入力されたプロンプト(指示文)から自由なテキスト・画像・音声などを新たに作り出す点が大きな違いです。総務省「令和7年版 情報通信白書」でも、2022年以降のLLMの実用化が「AIの爆発的進展」と表現されています。
「LLM≠生成AI」を意識する実務上の意味
業務でAIサービスを選定する際、「生成AIを導入する」と一言で表現してしまうと、テキスト生成(LLM)・画像生成・音声生成のどれを意味するかが曖昧になります。検討時には「テキスト生成(LLM)/画像生成/音声生成のうち、どれを業務のどの工程で使うのか」を明示することで、求める機能・コスト・リスクの議論がしやすくなります。生成AIの用途全般や代表例については、別記事『生成AIとは|種類・できること・代表例をわかりやすく解説』もご参照ください。
LLMの仕組み|トークン化と確率予測の流れ
LLMの中身は「次に来る単語(正確にはトークン)を確率的に予測し続けるエンジン」と整理できます。入力されたテキストを小さな単位に分割し、数値化し、過去の学習パターンから「次に来る確率が最も高いもの」を選び続けることで、自然な文章を生成します。
トークンとは|文字でも単語でもない「言語の最小単位」
LLMは文章を「トークン」と呼ばれる単位に分けて扱います。日本語では1文字=1トークンに近い場合もあれば、複数文字がまとめて1トークンになる場合もあります。たとえば「明日の天気は」という文は、4〜5個程度のトークンに分割されるイメージです。LLMの利用料金や処理速度がトークン数で課金・計測されることが多いため、業務利用ではトークン数を意識した設計が重要になります。
確率予測の本質|「考えている」のではなく「次に来る確率」を計算している
LLMは人間のように「意味を理解して回答を考えている」のではなく、学習データから得たパターンに基づいて「次に来る確率が高いトークン」を選び続けていると整理できます。この仕組みを理解しておくと、LLMが事実と異なる内容をもっともらしく出力する「ハルシネーション」が起きる理由も腑に落ちやすくなります。LLMから望ましい出力を得るための指示の出し方は、別記事『AIプロンプトとは|業務での書き方と注意点』で解説しています。
業務でLLMを使う際の3つのリスク
LLMを業務に取り入れる際、便利さの裏側にある「リスク」を理解しないまま使うと、誤情報の公開や情報漏洩などのトラブルにつながります。経済産業省・総務省「AI事業者ガイドライン(第1.2版)」では、AI利用者が留意すべき複数のリスクが整理されています。ここでは特に業務利用で顕在化しやすい3つを取り上げます。
ハルシネーション|「もっともらしい誤情報」への対応
LLMは確率に基づいて文章を生成するため、学習データにない情報や曖昧な質問に対して、もっともらしい誤った内容を返すことがあります。AI事業者ガイドラインでは、AIの出力を最終的な意思決定にそのまま用いず、人間の判断を介在させる「人間中心」の考え方が示されています。業務での活用では、出力内容を一次資料や複数情報源と照合し、責任の所在を明確にしたうえで使うことが基本です。
情報漏洩|入力データの取扱を必ず確認する
総務省「令和7年版 情報通信白書」では、企業が生成AI導入に際して挙げる懸念の上位に「社内情報の漏えい等のセキュリティリスク」が含まれることが示されています。サービスごとに「入力したデータをモデル学習に使うかどうか」が異なるため、業務利用前には利用規約・データ取扱方針を確認し、必要に応じて法人向けプラン(入力データを学習に使わない設定)を選ぶことが現実的な対応です。
著作権・権利侵害|公開前の類似性チェックを習慣化
LLMが生成した文章や、画像生成AIが作った画像が、既存の著作物に類似してしまうケースもあります。AI事業者ガイドラインに沿って、生成物を社外に公開する前に類似性を確認し、引用元が明確な場合は出典を明示する運用が望まれます。ガイドラインの全体像と業務での留意点は、別記事『AI事業者ガイドラインとは|概要と業務での活用ポイント』もあわせてご確認ください。
よくある質問(FAQ)
Q1. LLMと生成AIはどう違うのですか?
A. 生成AIはテキスト・画像・音声・動画など「新しいコンテンツを生成するAI」の総称で、LLMはその中でも「テキスト生成」を担う技術です。「生成AI ⊃ LLM」という包含関係で整理すると分かりやすくなります。
Q2. ChatGPTとLLMは同じものですか?
A. 厳密には異なります。ChatGPTはOpenAI社が提供する対話型サービスの名称で、その裏側でテキスト生成を担っているのがGPTシリーズというLLMです。サービス(ChatGPT)と、その内部の技術(LLM)を分けて理解すると、他社サービスとの比較もしやすくなります。
Q3. LLMは人間のように「考えて」いるのですか?
A. 人間と同じ意味で「考えて」いるわけではありません。学習データから得たパターンに基づき、次に来る確率が高いトークンを選び続けることで自然な文章を生成しています。この点を理解しておくことが、ハルシネーション等のリスクを正しく評価する出発点になります。
Q4. 業務でLLMを使うとき、まず何を確認すべきですか?
A. ①利用するサービスのデータ取扱方針(入力情報が学習に使われるか)、②社内で扱える情報の範囲、③出力の事実確認体制、の3点を最初に整理することが現実的です。AI事業者ガイドライン(第1.2版)の「AI利用者」向け項目を業務に合わせて参照することが推奨されます。
Q5. LLMの料金はどう計算されるのですか?
A. 多くのLLMサービスでは、入力と出力のトークン数に応じて課金されます。長い文章を扱うほどコストが上がるため、業務利用では「プロンプトを簡潔にする」「不要なやり取りを減らす」といった設計が運用コストに直結します。具体的な料金は各サービスの公式情報で最新値を確認してください。
Q6. 中小企業や個人事業主でもLLMを業務に使えますか?
A. 使えます。月額数千円程度から利用できる法人向け・個人向けプランも整備されており、文書作成・要約・翻訳・問い合わせ対応の下書きなど、特定業務に絞った活用から段階的に広げていくことが現実的です。導入前に、社内で扱える情報の範囲と出力の確認手順をルール化しておくと運用が安定します。
まとめ|今日からできる3つのこと
- 「生成AI ⊃ LLM」の包含関係を社内で共有する──サービス選定・社内説明の前提として、テキスト生成(LLM)・画像生成・音声生成のどれを使うかを明示する習慣をつけます。
- LLMの出力を「下書き」として扱うルールを決める──ハルシネーション対策として、対外公開・意思決定前に必ず人による事実確認を挟む運用を社内ルール化します。
- 利用するサービスのデータ取扱方針を確認する──入力データがモデル学習に使われるかどうかを契約・利用規約で確認し、必要に応じて法人向けプランを選択します。
関連記事
- 【経産省ガイドライン準拠】AIとは|中小企業が知るべき基礎と安全な始め方
- 生成AIとは|種類・できること・代表例をわかりやすく解説
- AIプロンプトとは|業務での書き方と注意点
- AI事業者ガイドラインとは|概要と業務での活用ポイント
- 「AI」の略は?正式名称と基礎用語の整理
参考文献
- 経済産業省・総務省「AI事業者ガイドライン(第1.2版)」/経済産業省・総務省/2026年3月31日/https://www.meti.go.jp/shingikai/mono_info_service/ai_shakai_jisso/pdf/20260331_1.pdf/取得日:2026年5月31日
- 総務省「令和7年版 情報通信白書」第Ⅰ部第1章第2節(AIの爆発的進展の動向/企業におけるAI利用の現状)/総務省/2025年7月/https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/r07/html/nd112220.html/取得日:2026年5月31日
- 総務省「令和7年版 情報通信白書」第Ⅰ部第1章第2節(個人におけるAI利用の現状)/総務省/2025年7月/https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/r07/html/nd112210.html/取得日:2026年5月31日
この記事に興味を持った方におすすめ