AIトークンとは|生成AIの料金と文字数を決める仕組みを解説

Check!

  • トークン=生成AIが文章を扱う最小単位(料金と長さを左右)
  • トークン数は文字数と一致しない(日本語は多めになりやすい)
  • 料金は入力+出力トークンの量で決まるのが一般的

「生成AIのAPI利用料が想定より高くなった」「長い文章を入れたら途中で切れてしまった」──業務でAIを使い始めた個人事業主や企業の担当者から、こうした声をよく聞きます。その背景にあるのが「トークン」という単位です。生成AIの活用方針を定めている日本企業は49.7%、中小企業では約34%にとどまりますが(総務省「令和7年版 情報通信白書」)、いざ使い始めると料金や入力できる長さの仕組みでつまずく場面は少なくありません。本記事では、AIトークンとは何かを「文字数との違い」「料金とコンテキスト上限の仕組み」からやさしく整理し、あわせて押さえたいAIの基礎用語までまとめて解説します。専門知識がなくても、自社のAI利用コストを見通せるようになる内容です。まずはAIそのものの全体像を知りたい方は、AIとは(基礎から知りたい方はこちら)もあわせてご覧ください。

目次

開く

閉じる

  1. AIトークンとは?──生成AIが文章を扱う「最小単位」
  2. トークンと文字数はどう違う?日本語・英語での数え方の目安
  3. トークンが料金と性能を左右する仕組み
  4. あわせて押さえたいAI基礎用語ミニ辞典
  5. ビジネスでトークンを意識する場面と注意点
  6. よくある質問(FAQ)
  7. まとめ|今日からできる3つのこと
  8. 関連記事
  9. 参考文献

AIトークンとは?──生成AIが文章を扱う「最小単位」

図1:トークン分割のイメージ 1つの文章が複数のトークンに分割される様子 入力した文章 私はAIを使う。 トークンに分割(トークン化) AI 使う この例では6トークン 分割の仕方はAIモデルや言語で変わります
図1:トークンは文章を細かく分けた「かたまり」。数え方はモデルや言語で変わる

AIトークンとは、生成AIが文章を読み書きするときに扱う最小の単位のことです。料金や一度に入力できる長さは、このトークンの数で決まります。まずはこの一点を押さえると、料金や上限の話が理解しやすくなります。

トークンの定義(編集部の技術解説)

人が文章を「単語」や「文字」で読むのに対し、ChatGPTやClaude、Geminiといった生成AIは、文章をトークンという独自のかたまりに分けてから処理します。たとえば「私はAIを使う。」という一文は、「私」「は」「AI」「を」「使う」「。」のように分けられ、この一つひとつがトークンです。文章をトークンに分ける処理を「トークン化」と呼びます。生成AIの中心にある大規模言語モデル(LLM)は、このトークンの並びをもとに「次に来るトークン」を予測しながら文章を生成しています。生成AIとLLMの全体像については、生成AIとはで詳しく解説しています。

なぜ「文字」でも「単語」でもないのか

トークンは「文字」とも「単語」とも一致しません。短い単語は1トークンになることもあれば、長い単語や複雑な表記は複数トークンに分かれることもあります。AIが効率よく言語を処理できるよう、文字と単語の中間のような単位で区切られていると考えると分かりやすいでしょう。そのため、同じ内容でもモデルによってトークン数が変わる点に注意が必要です。

トークンと文字数はどう違う?日本語・英語での数え方の目安

図2:日本語と英語のトークン数のイメージ 同じ意味の文でも言語によってトークン数の目安が変わる対比図 同じ意味でも言語でトークン数は変わる 日本語の文 文字数より多めのトークンになりやすい 漢字・かなが細かく分割されるため 英語の文 単語単位で比較的少なめ ※数値は目安。モデルや文章で変動します
図2:日本語は英語に比べてトークン数が多くなりやすい(あくまで目安)

「トークン数=文字数」と思われがちですが、両者は一致しません。トークンは文字や単語とは異なるAI独自の単位のため、同じ文章でも文字数とトークン数はずれます。この違いを知っておくと、料金や入力できる長さの見積もりがしやすくなります。

日本語は文字数より多くなりやすい

一般に、日本語は英語に比べて、同じ意味の文章でもトークン数が多くなりやすい傾向があります。日本語は漢字やひらがなが細かく区切られて処理されることが多いためです。正確な換算率はモデルによって異なるため、ここでは「日本語は文字数よりトークン数が膨らみやすい」という傾向として押さえておけば十分です。具体的なトークン数は、各AIサービスが提供するカウント機能で確認できます。

記号・空白・絵文字の扱い

句読点や空白、記号、絵文字なども、それ自体がトークンとして数えられます。装飾的な記号を多用した長い文章は、見た目以上にトークンを消費することがあります。コストや上限を意識する場面では、不要な記号や重複表現を減らすことが、結果的にトークンの節約につながります。

トークンが料金と性能を左右する仕組み

図3:トークンが料金とコンテキスト上限を左右する仕組み 入力トークンと出力トークンが料金になり、コンテキスト上限を超えると古い内容が忘れられる概念図 料金はトークンの量で決まる(一般的な方式) 入力トークン 質問・指示・資料 出力トークン AIの回答 合計トークン量 → 料金 コンテキスト上限という「窓」がある 上限内:すべて考慮 超過分は… 上限を超えると古い内容から忘れられていく
図3:入力+出力のトークン量が料金に、コンテキスト上限が「一度に扱える長さ」に影響する

トークンを理解すると、生成AIの「料金」と「一度に扱える長さ」という2つの実務的な疑問がつながって見えてきます。ここではその仕組みを整理します。

入力トークンと出力トークンで課金されるのが一般的

多くの生成AIサービス(特にAPI利用)では、AIに送る文章(入力トークン)と、AIが返す文章(出力トークン)の合計量に応じて料金が決まる方式が一般的です。長い資料を貼り付けたり、長文の回答を何度も生成したりすると、その分トークンが増え、利用料も増えます。「想定より料金が高い」と感じる多くの場合、入力・出力トークンが積み上がっていることが背景にあります。料金の体系はサービスやプランによって異なるため、具体的な単価は各社の公式情報で確認してください。月額定額のチャットプランではトークン量を直接意識しない設計のものもあります。

コンテキスト上限を超えると古い内容が忘れられる

生成AIには、一度に扱えるトークン数の上限(コンテキスト上限、コンテキストウィンドウ)があります。会話や入力した資料がこの上限を超えると、古い内容から順に考慮されなくなり、「さっき伝えたはずの前提を忘れる」「長文の後半しか読まれない」といった現象が起きます。長文が途中で切れたように見えるのも、この上限が関係しています。上限の大きさはモデルによって差があるため、長い資料を扱うときは、要点に絞る・分割する、といった工夫が有効です。対話型AIの選び方は、Claude(クロード)とはなどの個別解説もあわせて参考になります。

あわせて押さえたいAI基礎用語ミニ辞典

図4:AI基礎用語の関係図 AIの中に生成AIがあり、その中核にLLMがある包含関係と、トークン・プロンプト・APIの位置づけ 用語どうしの関係 AI(人工知能) 生成AI LLM(大規模言語モデル) トークンを予測して文章を生成する中核 トークン プロンプト API トークン=処理単位/プロンプト=指示文/API=外部連携の窓口 出典:総務省・経済産業省「AI事業者ガイドライン(第1.2版)」(2026年)の枠組みを参考に編集部作成
図4:AI ⊃ 生成AI ⊃ LLM の関係。トークン・プロンプト・APIはその周辺の基礎用語

トークンの理解を深めるには、周辺の基礎用語もあわせて押さえると効果的です。ここでは、生成AIを使ううえでつまずきやすい用語を短くまとめます。それぞれの位置づけは、総務省・経済産業省「AI事業者ガイドライン(第1.2版)」が示すAIの枠組み(AIを開発者・提供者・利用者の3主体でとらえる考え方)とあわせて理解すると整理しやすくなります。

用語かんたんな意味
AI(人工知能)「Artificial Intelligence」の略で、人間の知的な働きをコンピュータで再現する技術の総称。詳しくは「AIは何の略?」を詳しく
生成AI文章・画像・音声などを新しく作り出すAI。ChatGPTやGeminiが代表例。生成AIの全体像を解説した記事も参照。
LLM(大規模言語モデル)大量の文章を学習し、トークンの並びを予測して文章を生成する、生成AIの中核となるモデル。
トークン生成AIが文章を扱う最小単位。料金と入力できる長さを左右する(本記事の主題)。
プロンプトAIへの指示文・質問文。書き方で回答の質が変わる。AIプロンプトとは|業務での書き方
API外部のソフトとAIをつなぐ窓口。自社システムに生成AIを組み込むときに使う。
機械学習・ディープラーニングデータからパターンを学ぶ仕組み。ディープラーニングはその発展形で、現在のAIの基盤。
AGI(汎用人工知能)人間のように幅広い課題に対応できるとされる、まだ実現していない概念上のAI。

ビジネスでトークンを意識する場面と注意点

図5:ビジネスでトークンを意識する3つの場面 コスト管理・長文の分割・入力情報の取り扱いの3場面のチェックリスト トークンを意識したい3場面 1 コスト管理 入力・出力トークンの積み上げを把握する 2 長文は分割して投入 上限超過による「忘れ」を防ぐ 3 入力情報の取り扱い 機密・個人情報の入力は社内ルールで管理 AI事業者ガイドライン(利用者の責務)を参照 出典:総務省・経済産業省「AI事業者ガイドライン(第1.2版)」(2026年)
図5:コスト管理・長文の分割・入力情報の取り扱いの3点を押さえる

トークンは技術者だけのものではありません。生成AIを業務で使うなら、規模を問わず次の3つの場面で意識しておくと、コストとリスクの両面で役立ちます。

コスト管理:積み上がるトークンを見える化する

API利用やトークン課金のプランでは、利用が増えるほどトークンも増え、料金に直結します。個人事業主であれば自分の利用量を、組織であれば部門ごとの利用量を定期的に確認し、想定外の増加に早めに気づける状態にしておくことが大切です。長い前提文を毎回貼り付けるより、要点を絞ったプロンプトにするだけでもトークンの節約につながります。

長文は分割して投入する

長い資料をそのまま投入するとコンテキスト上限を超え、回答の精度が落ちることがあります。資料を章ごとに分ける、不要な部分を削る、要約してから渡すといった工夫で、上限内に収めやすくなります。これはコスト削減にも有効です。

入力する情報の取り扱いに注意する

トークンの話とあわせて忘れてはならないのが、何を入力するかという情報管理の観点です。総務省・経済産業省「AI事業者ガイドライン(第1.2版)」は、AIを使う「利用者」にも、入力する情報や出力の取り扱いに責任があるという考え方を示しています。機密情報や個人情報を安易に入力しないなど、社内ルールをあらかじめ定めておくことが望まれます。組織内ルールの策定にあたっては、組織内ルール策定の参考になるガイドライン解説もあわせてご確認ください。

よくある質問(FAQ)

Q. トークンと文字数は同じですか?

A. 同じではありません。トークンは文字や単語とは異なるAI独自の単位で、同じ文章でも文字数とトークン数はずれます。正確なトークン数は各AIサービスのカウント機能で確認できます。

Q. 日本語と英語でトークン数が違うのはなぜですか?

A. 言語ごとに分割のされ方が異なるためです。一般に日本語は漢字やかなが細かく区切られ、同じ意味でも英語よりトークン数が多くなりやすい傾向があります。正確な比率はモデルによって変わるため、目安として捉えてください。

Q. トークン数を減らすにはどうすればよいですか?

A. プロンプトを要点に絞る、不要な記号や重複表現を減らす、長文は分割するといった工夫が有効です。トークンを減らすとコスト削減と精度維持の両方に役立ちます。

Q. トークンと「AIの略」は関係ありますか?

A. 直接の関係はありません。「AI」はArtificial Intelligence(人工知能)の略で、トークンは生成AIが文章を処理するときの単位です。AIという言葉の意味や正式名称を確認したい方は、AIの正式名称を確認する記事をご覧ください。

Q. プロンプトとトークンの違いは何ですか?

A. プロンプトはAIへの「指示文・質問文」そのもの、トークンはその文章を処理する際の「単位」です。プロンプトが長くなれば、その分トークンも増えます。書き方の基本はAIプロンプトとはで解説しています。

Q. 中小企業や個人でもトークンを気にする必要はありますか?

A. 利用規模が小さくても、料金や回答精度に関わるため知っておく価値があります。特にAPI利用や従量課金のプランでは、トークンの理解がそのままコスト管理につながります。月額定額のチャットプラン中心であれば、まずは「長文が切れる理由」を把握しておく程度で十分です。

まとめ|今日からできる3つのこと

AIトークンとは、生成AIが文章を扱う最小単位であり、料金と入力できる長さを左右する重要な概念です。仕組みを押さえれば、コストの見通しと安全な使い方の両方が一段とクリアになります。最後に、今日から実践できる3つのことを整理します。

  1. 利用しているAIのトークン上限(コンテキスト上限)を確認する
  2. 長い資料や文章は、要点に絞る・分割してから投入する
  3. 機密情報・個人情報の入力について、社内ルールを決めておく(AI事業者ガイドラインを参照)

関連記事

参考文献

同じカテゴリの記事を探す

同じタグの記事を探す

同じタグの記事はありません

top