👓
主要AIモデル コストパフォーマンス比較 (コーディング特化) 【2025年2月10日更新】
Github Copilot Agentの覚醒
https://github.blog/jp/2025-02-07-github-copilot-the-agent-awakens/
ついにGithub Copilot Agentが登場しました。Roo Codeもまだ試せていないため、主要AIモデルとAPI料金を整理し、コーディングAIエージェント活用を検討します。
前提
本記事は個人調査であり、特定モデル推奨ではありません。性能評価は主観的要素を含みます。用途はコーディングAIエージェントに限定し、コストパフォーマンスを重視。Github Copilot Agentは月額$10固定料金のため、料金内で最大限の価値を評価します。
概要
コーディングAIエージェント向け、コストパフォーマンスに優れたAIモデル比較。月額固定料金制のGithub Copilot Agentにおいて、月額料金内の価値 を考慮し評価。
結論
Github Copilot Agent 月額$10固定料金下での有力候補:
- バランス: GPT-4o (default)
- 高性能: Claude 3.5 Sonnet (Preview)
- 速度: Gemini 2.0 Flash (Preview)
定額という条件であれば、Claude 3.5 Sonnet (Preview)が最も良さそうです。
(そのぶんRateLimitも厳しそうではありますが)
モデル別詳細 (コストパフォーマンス評価)
Github Copilot Agent 月額$10固定料金前提、各AIモデルをコストパフォーマンスで評価。
※ Github Copilot Agent で選択可能なモデル
モデル | 特徴 | コストパフォーマンス | 推奨利用シーン |
---|---|---|---|
Gemini 2.0 Flash (Preview) | 低コスト、高速、最軽量 | 非常に高い (速度重視、日常タスク) | 日常コーディング、高速応答 |
GPT-4o (default) | マルチモーダル、日常タスク強、高速、デフォルト | 高い (バランス重視、幅広いタスク) | 日常〜複雑タスク、バランス性能 |
Claude 3.5 Sonnet (Preview) | 複雑タスク向け、o1に近い性能? | 非常に高い (高性能、複雑タスク) | 複雑タスク、高度コーディング支援、GPT-4oと比較検討 |
参考資料:API価格表 (2025年2月10日時点)
以下はRoo Codeで使うために各API価格を価格順にまとめたものです。
特にGeminiは無料枠があるので使いやすそうです。
提供元 | モデル | 特徴 | Input価格 (1Mトークンあたり) | Output価格 (1Mトークンあたり) |
---|---|---|---|---|
gemini Flash Lite Preview | Gemini Flash の軽量版 | $0.075 | $0.30 | |
gemini Flash | 軽量高速 ChatGPT o1-mini, Claude haiku に近い? | $0.10 | $0.70 | |
OpenAI | gpt-4o-mini | GPT-4oの軽量版 | $0.15 | $0.60 |
Anthropic | claude haiku | 軽量高速、o1-miniに近い? | $0.80 | $4.00 |
OpenAI | o1-mini | o1の軽量版 STEM分野(科学、技術、工学、数学)でo1と同等の性能 | $1.10 | $4.40 |
OpenAI | o3-mini | o1の上位モデル、速度とコスパ上昇。思考の深さを選択可能。テキスト特化 | $1.10 | $4.40 |
OpenAI | gpt-4o | マルチモーダル、日常タスクに強い。o1より早い | $2.50 | $10.00 |
Anthropic | claude sonnet | 複雑なタスク o1に近い? | $3.00 | $15.00 |
OpenAI | o1 | 複雑な問題特化、「考える」モデル。コーディング力が高い | $15.00 | $60.00 |
OpenAI | o1 pro (preview) | o1の強化版 特に数学が強い | $15.00 | $60.00 |
Anthropic | claude Opus | o1 proに近い? | $15.00 | $75.00 |
Discussion