Grok Code Fast1 の詳細
はじめに
おそくなりましたが、「Grok Code Fast1」の詳細が xAI から公開されていたので、紹介します。
Grok Code Fast1 の詳細
Grok Code Fast1 は、2025/08/27に、Windsurf に突如取り入れられたモデルです。
発表当初は、情報がなく謎のモデルでした。
2025/08/27に Windsurf に追加されて、翌日の 2025/08/28 に xAI の公式 Web サイトに情報が掲載されたようです。
読んでいくと Grok Code Fast1 は、
- 全く新しいモデルアーキテクチャで作られている。
- 各 IDE ベンダと協力して、期間限定で無料で提供。
- かなり高速で動くらしい。
- 高速化のための革新的な技術を開発したらしい。
- プロンプトキャッシングに投資しており、Windsurf や Cursor などで使用した場合、90%以上のキャッシュヒット率を実現。
- ソフトウェア開発のフルスタックの分野で多才。特に下記の言語に強い。
- TypeScript
- Python
- Java
- Rust
- C++
- Go
- 経済的。開発者が日々直面するタスクで活躍するために作られたらしい。
- input token: $0.20/1M tokens
- output token: $1.50/1M tokens
- cached input token: $0.02/1M tokens
- モデルパフォーマンスの評価時には、ベンチマークと経験のある開発者の評価を利用した。
- ベンチマークは現実世界のソフトウェアエンジニアリングのニュアンスを完全に反映するわけではないため、経験のある開発者の評価も考慮したらしい。
- 開発時には、人間の評価によって導出された満足度とユーザビリティに焦点を当てた。
- SWE-bench verified で 70.8% を記録。
どうやら、ソフトウェアエンジニアリング分野のタスク実行に重きを置いているようですね。
2025/08/27 に、Cursor や Windsurf などの各 IDE ベンダが同時に「Grok Code Fast1」を提供したことも計画されていたということですね。
性能面
コスト面では図が提示されていて、1秒ごとのトークン処理数、コスパ共に圧倒的に優れているようです。
SWE-bench verified で 70.8% を記録したとのことで、他のモデルと比較してみると下記のようになります。
モデル | SWE-bench verified の値 |
---|---|
Grok Code Fast1 | 70.8% |
Claude Opus 4.1 | 74.5% |
Claude Sonnet 4 | 72.7% |
GPT-5 | 74.9% |
Qwen3-Coder | 69.6% |
安価かつ高速というメリットを持ちながら、この性能は破格だと思います。
また、ベンチマークだけでなく、実際の開発者の評価もトレーニング時に考慮されており、ソフトウェアエンジニアリング特化して訓練されているようなので、そのあたりどういった結果を生成してくれるのか楽しみです。
これからコーディングしながら性能を体感していこうかなと思います。
もしかしたら、特化している分、他のモデルよりもいい結果を出してくれるのかもしれません。
現在(2025/09/14時点)は、Windsurf では無料で利用できます。
おそらく無料期間が終わっても、高い credit 設定にはならないのではと考えております。
これで、高 credit 設定であれば、メリットどこ行ったって話になりますし...
まとめ
新しいモデルが出るのは大変嬉しいことなのですが、ちょっと触り切れていない部分もあるので、時間を捻出して触れていこうと思います。
遅くなりましたが、Grok Code Fast1 の紹介でした。
次回は AWS Athena の続きの記事になると思います。
Discussion