🎮

GPT-5 vs Gemini 2.5 Pro vs Grok-Code-Fast-1:Agentic Coding 結果比較

に公開

はじめに

grok-code-fast-1がSWE-benchが70越えで安く速いという事でかなり期待していました。
現在無料で使えますので簡単なゲームをコーディングさせGPT-5およびGemini 2.5 Proと比較してみました。

比較環境

今回の比較にあたり、以下の組み合わせで実施しました。

  • GPT-5(high) & codex-cli
  • Grok-Code-Fast-1 & cline
  • Gemini 2.5 Pro & gemini-cli

成果物比較

タイトル画面

まずは、各モデルが生成したゲームのタイトル画面を見てみましょう。

GPT-5

GPT-5によるタイトル画面

Grok-Code-Fast-1

Grok-Code-Fast-1によるタイトル画面

Gemini 2.5 Pro

残念ながら、Gemini 2.5 Proはタイトル画面を正常に表示させることができませんでした。

ゲーム画面

次に、実際のゲームプレイ画面です。

GPT-5

GPT-5によるゲーム画面

Grok-Code-Fast-1

Grok-Code-Fast-1によるゲーム画面

中間成果物のキャラクターデザイン

開発途中で生成されたキャラクターデザインも比較してみます。

GPT-5

GPT-5によるキャラクターデザイン

Grok-Code-Fast-1

Grok-Code-Fast-1によるキャラクターデザイン

Gemini 2.5 Pro

Gemini 2.5 Proによるキャラクターデザイン

コーディング性能比較まとめ

今回の検証から見えてきた、各モデルのコーディング性能に関する所感を以下にまとめます。

  • コード品質:

    • GPT-5 >> Grok-Code-Fast-1 > Gemini 2.5 Pro
  • 実装速度:

    • Grok-Code-Fast-1が最も高速でした。
    • Gemini 2.5 Proは実装に時間がかかる傾向がありました。
  • デザインセンス:

    • Grok-Code-Fast-1が生成したUIやキャラクターは、デザイン的に優れている印象を受けました。

結論

Grok-Code-Fast-1のコーディング性能はGPT-5には及ばないですが、費用とレスポンス速度を考えると十分魅力的に感じました。
簡単なタスクや速度重視なタスクをGrok-Code-Fast-1に置き換えるといった使い方が現実的でしょうか。

Discussion