🧠

物量攻撃:数こそ力なり。 2025年5月の生成AIモデル コスト対効果 比較表

に公開

生成AIのAgentを利用したサービスをつくるにあたり、 コストやできることの差分の把握が必要になりました。 その内容を下記にまとめます。

数こそ力なり

入力できるcontext の分量がモデルごとに大きく違うということが自分自身新たな発見でした。 私の以前の理解では大量の入力はそもそもできないので、事前知識は数値化して、VectorDBなどに保存して、類似度の高い知識をピックアップして生成AIにわたす(RAG)が必要というものでした。 
しかし、OpenAIにくらべてGeminiのほうが圧倒的に入力コンテキストを多くできるということで、やってみたところ、期待する生成AIのOutputが劇的に良くなるという実感を得ました。私の例では38page, 4万文字の日本語入力をもとに生成させましたが全く問題なく動作してくれました。
これは単純にコストの比較ではなく、一方では実現できないことが、他方ではできるという圧倒的な差異化ポイントだと感じました。

なので、現時点(2025年5月)で各社の最高モデル、コスパ対応モデルそれぞれでの入力トークン数、コストなどを一覧にまとめました。  日進月歩ですのでその都度最新モデルの情報を確認しご参照ください。

下記内容はGemini2.5 DeepResearchの結果をもとに作成しています
(1)(2)などの数字は最後の引用のURLに対応しています

生成AIの料金体系について

生成AIサービスのコストを理解するためには、まずその料金体系の基本的な構成要素を把握する必要があります。これらの要素はプロバイダーやモデルによって細部が異なりますが、共通する主要な概念が存在します。

主要なコスト構成要素

  • 入力トークン (Input Tokens): モデルに対して送信するプロンプトやデータ(テキスト、画像データなど)の量に応じて課金されます。これは、モデルに処理を依頼する「質問」や「指示」のコストと考えることができます。
  • 出力トークン (Output Tokens): モデルが生成・返信するテキストやデータの量に応じて課金されます。これは、モデルからの「回答」や「成果物」のコストに相当します。一般的に、出力トークンは入力トークンよりも単価が高く設定される傾向があります。これは、生成プロセスがより多くの計算資源を消費するためと考えられます (6)。
  • モデル (Model Tiers): 各プロバイダーは、能力(精度、速度、機能セット)とコストが異なる複数のモデルを提供しています。例えば、OpenAIはGPT-4oシリーズやGPT-4.1シリーズ(GPT-4.1、GPT-4.1 mini、GPT-4.1 nanoなど) (1)、AnthropicはClaudeファミリー(Opus、Sonnet、Haiku) (3)、GoogleはGeminiファミリー(Pro、Flashなど) (5) を展開しており、それぞれのティアに応じた料金設定がなされています。

トークン計算の基本

トークンは、LLMがテキストやその他のデータを処理する際の基本単位です。プロバイダーやモデル、さらには言語によって、文字数や単語数とトークン数の換算レートは異なります。

  • OpenAI: 英語の場合、1トークンはおおよそ4文字、または単語の約3/4に相当するとされています (8)。日本語のようなマルチバイト文字を使用する言語では、同じ文字数でも英語より多くのトークンを消費する傾向があります。OpenAIは、テキストをトークンに分割する方法を確認できるTokenizerツールを提供しています (8)。画像入力の場合、画像はトークンに変換されて課金されますが、その計算方法はモデルによって異なる場合があります (1)。
  • Anthropic: 画像入力の場合、トークン数は概算として(幅ピクセル × 高さピクセル)÷ 750 で計算できます (9)。テキストに関しては、Anthropicもトークンカウント用のAPIエンドポイントを提供しており、開発者はAPIコール前にトークン数を見積もることが可能です (10)。
  • Google: 英語では1トークンあたり約4文字が目安とされています (11)。マルチモーダル入力の場合、画像、音声、動画はそれぞれ固定レートでトークンに変換されます。例えば、動画は1秒あたり263トークン、音声は1秒あたり32トークンとして計算されます (11)。

トークン化の仕様はプロバイダーやモデル、言語によって異なるため、特に多言語対応サービスやマルチモーダル入力を扱うサービスを開発する際には、正確なトークン数を把握するためのテストが重要です。日本語の場合、英語と比較して1文字あたりのトークン数が多くなる傾向があり、これがコスト増に繋がる可能性がある点を認識しておく必要があります。例えば、OpenAIのドキュメントでは、スペイン語の「Cómo estás」(10文字)が5トークンとなる例が示されており、英語以外の言語でのトークン効率の違いを示唆しています (8)。

プロバイダー横断比較分析

主要な先進モデルとコスト効率の高いモデルを横断的に比較し、いくつかの代表的な利用シナリオにおける考察をおこないます。

主要先進モデルおよびコスト効率の高いモデルの主要指標比較サマリー表 (表 主要モデルサマリー比較)

以下に、OpenAI、Anthropic、Googleからそれぞれ代表的な先進的モデル1種とコスト効率の高いモデル1種を選び、主要な指標を比較します。料金はテキスト処理を基本とし、100万トークンあたりの米ドル表記です。

特性 OpenAI GPT-4.1 OpenAI GPT-4o mini Anthropic Claude Opus 4 Anthropic Claude Haiku 3.5 Google Gemini 2.5 Pro Preview Google Gemini 2.5 Flash Preview
モデルタイプ 先進的 コスト効率 先進的 コスト効率 先進的 コスト効率
テキスト入力コスト/1Mトークン $2.00 (1) $0.15 (2) $15.00 (3) $0.80 (3) $1.25 (≤200k) / $2.50 (>200k) (5) $0.15 (テキスト/画像/動画) (5)
テキスト出力コスト/1Mトークン $8.00 (1) $0.60 (2) $75.00 (3) $4.00 (3) $10.00 (≤200k) / $15.00 (>200k) (5) $0.60 (非思考) / $3.50 (思考) (5)
最大コンテキスト(入力) 1M トークン (7) 128K トークン (18) 200K トークン (3) 200K トークン (3) 1M トークン (21) 1M トークン (21)
最大出力トークン 32,768 トークン (7) 16,384 トークン (18) 32,000 トークン (4) 8,192 トークン (4) 65,536 トークン (21) 65,536 トークン (21)
主なマルチモーダル対応(入力) テキスト, 画像 (15) テキスト, 画像 (18) テキスト, 画像 (4) テキスト, 画像 (4) テキスト, 画像, 動画, 音声 (21) テキスト, 画像, 動画, 音声 (21)
ファインチューニング (API経由) 可 (トレーニング $25/1M) (1) 可 (トレーニング $3/1M) (2) 限定的/要問合せ (BedrockでHaikuは可 (13)) 限定的/要問合せ (BedrockでHaikuは可 (13)) 可 (トレーニング $8/1M) (12) 不明

このサマリー表は、ユーザーが3社の「主要なProvider」の「先進的」モデルと「コスト対効果が高い」モデルを迅速に比較検討するためのものです。各社のフラッグシップモデル(GPT-4.1, Claude Opus 4, Gemini 2.5 Pro)は高い能力を持つ一方でコストも高く、コスト効率モデル(GPT-4o mini, Claude Haiku 3.5, Gemini 2.5 Flash)は大幅に安価なトークン単価を提供しています。コンテキストウィンドウやマルチモーダル対応、ファインチューニングの提供状況にも大きな違いがあり、これらの要素を総合的に評価することが求められます。

シナリオ別考察

特定の利用シナリオにおいて、どのプロバイダーのどのモデルが適しているかは、コストだけでなく機能や性能特性によっても左右されます。

  • コストを最優先する場合:
    • 候補モデル: Google Gemini 1.5 Flash-8B/2.0 Flash-Lite、Anthropic Claude Haiku 3.5、OpenAI GPT-4o mini/GPT-4.1 nano。
    • 戦略: これらのモデルは、100万トークンあたりの単価が他の高性能モデルと比較して大幅に低く設定されています。特にGoogle Cloudが提供するGemini APIの無料利用枠は、初期開発コストを抑える上で非常に有効です。OpenAIが実施していたデータ共有プログラム(2025年4月末まで)も、期間内であれば組織にとって大きなメリットがありましたが、その後の状況は確認が必要です。AnthropicのClaude Haiku 3.5も、バッチ処理を活用することでさらにコストを圧縮できます。
  • 最高性能・多機能性を重視する場合:
    • 候補モデル: Google Gemini 2.5 Pro Preview、OpenAI GPT-4.1/GPT-4o、Anthropic Claude Opus (4)。
    • 戦略: これらのフラッグシップモデルは、複雑な推論、高度なコーディング支援、高品質なコンテンツ生成、広範なマルチモーダル対応など、最先端の能力を提供します。ただし、コストも相応に高くなるため、開発するサービスで真にこれらの高度な機能が必要かどうかを慎重に見極め、必要な機能(特定のモダリティ処理、ツール連携、超長文コンテキストなど)とコストのバランスを吟味する必要があります。
  • 長文処理が主要なユースケースの場合:
    • 候補モデル: OpenAI GPT-4.1シリーズ(最大1Mトークン)、Google Gemini 1.5 Pro(最大2Mトークン)/Gemini 2.5 Pro(最大1Mトークン)。
    • 戦略: これらのモデルは非常に大きなコンテキストウィンドウをサポートしており、大量の文書分析や長大な対話履歴の維持に適しています。AnthropicのClaudeモデル群も全モデルで200Kトークンという十分なコンテキストウィンドウを提供しており、多くの長文処理タスクに対応可能です。
  • マルチモーダルサービスを開発する場合:
    • 候補モデル: Google Geminiファミリー、OpenAI GPT-4o。
    • 戦略: GoogleのGeminiモデル群は、APIレベルでテキスト、画像、音声、動画といった多様な入力モダリティに最も広範に対応しており、料金体系もモダリティ別に設定されています。OpenAIのGPT-4oも画像や音声入力に強力に対応しています。開発するサービスが必要とする具体的なモダリティと、その処理量に応じたコスト評価が重要です。

引用文献

  1. Pricing | OpenAI https://openai.com/api/pricing/
  2. Pricing - OpenAI API https://platform.openai.com/docs/pricing
  3. Pricing - Anthropic https://www.anthropic.com/pricing
  4. Models overview - Anthropic API https://docs.anthropic.com/en/docs/about-claude/models/overview
  5. Gemini Developer API Pricing | Gemini API | Google AI for Developers https://ai.google.dev/gemini-api/docs/pricing
  6. Comparing API Pricing of Leading AI Models for Chatbots, Analytics, and Embeddings https://www.pipemind.com/en/post/comparing-api-pricing-of-leading-ai-models-for-chatbots-analytics-and-embeddings
  7. Introducing GPT-4.1 in the API - OpenAI https://openai.com/index/gpt-4-1/
  8. What are tokens and how to count them? - OpenAI Help Center https://help.openai.com/en/articles/4936856-what-are-tokens-and-how-to-count-them
  9. Vision - Anthropic API https://docs.anthropic.com/en/docs/build-with-claude/vision
  10. Token counting - Anthropic API https://docs.anthropic.com/en/docs/build-with-claude/token-counting
  11. Understand and count tokens | Gemini API | Google AI for Developers https://ai.google.dev/gemini-api/docs/tokens
  12. Vertex AI Pricing | Generative AI on Vertex AI | Google Cloud https://cloud.google.com/vertex-ai/docs/generative-ai/pricing
  13. Newsroom \ Anthropic https://www.anthropic.com/news
  14. Meet Claude \ Anthropic https://www.anthropic.com/product
  15. Azure OpenAI in Azure AI Foundry Models - Learn Microsoft https://learn.microsoft.com/en-us/azure/ai-services/openai/concepts/models
  16. Introducing OpenAI o3 and o4-mini https://openai.com/index/introducing-o3-and-o4-mini/
  17. Free OpenAI & every-LLM API Pricing Calculator | Updated May 2025 - DocsBot AI https://docsbot.ai/tools/gpt-openai-api-pricing-calculator
  18. Model - OpenAI API https://platform.openai.com/docs/models/gpt-4o-mini
  19. How can I access GPT-4o and GPT-4.1 mini? | OpenAI Help Center https://help.openai.com/en/articles/7102672-how-can-i-access-gpt-4o-and-gpt-4-1-mini
  20. Introducing 4o Image Generation - OpenAI https://openai.com/index/introducing-4o-image-generation/
  21. Gemini models | Gemini API | Google AI for Developers https://ai.google.dev/gemini-api/docs/models
  22. Amazon Bedrock vs Azure OpenAI vs Google Vertex AI: An In-Depth Analysis​ https://www.cloudoptimo.com/blog/amazon-bedrock-vs-azure-openai-vs-google-vertex-ai-an-in-depth-analysis/
  23. Google AI Plans and Features https://one.google.com/about/google-ai-plans/
シンギュラリティ・ソサエティ

Discussion