🦃

無料プロモーション中のコスパに優れたコーディングモデル grok-code-fast-1 を試してみる

2025/09/02に公開

びーぐるです🐶
2025年8月28日、xAIからコーディング特化のモデル、grok-code-fast-1がリリースされました。
https://x.ai/news/grok-code-fast-1
現在、リリースに合わせて無料プロモーションが開催されています。

今回はこちらのモデルについて調査し、実際にこのモデルを使って性能や挙動を検証していきたいと思います。

 更新履歴2025/09/02 公開しました
2025/09/03 「定量的な性能の検証」に追記しました
2025/09/16 無料プロモーション終了時期が未定になったため、該当箇所を修正しました

 grok-code-fast-1とは？X(旧Twitter)でおなじみ、xAI社が開発したコーディングモデルです。

grok-code-fast-1(Grok Code)はAgentic Codingに特化されていて、高速かつ性能が高いのにもかかわらずコスパに優れるとされています。
このモデルに関しては、既存のxAIのモデルであるGrokをベースにしていません。

全く新しいモデルに、事前学習として様々なプログラミングコンテンツをコーパスとし、事後学習として実際に発行されたプルリクエスト・コーディング用のタスクが用いられたようです。
説明文からは、かなり実践的なモデルに仕上がっているような印象を受けます。

更にはコンテキストウィンドウは256,000と十分にあります。

 使い方GrokにはオフィシャルなコーディングツールやIDEが存在していないため、他社のIDE・ツール類から呼び出すことになります。

実際にオフィシャルで名が挙げられているのは
IDE
Cursor

Kilo Code(Kiroのtypoではなく、別物です)
Windsurf
CLI
opencode
Extensions
GitHub Copilot
Cline
Roo Code
となっています。

上記開発ツールから利用するのであれば、9/10まで無料で利用できます(終了日未定)。

完全に無料で試すのであれば、opencodeやClineを利用するのがおすすめです。
https://x.com/veggie_eric/status/1961877264599306573

 IDEからの使い方AI IDEから利用するには、利用するモデルをgrok-code-fast-1に設定するだけでよいと思います。

ただしCursor, Windsurfでの利用はそれぞれのサービスの有料プランへの加入が必須なようです。

Kilo Codeは利用したことがないのでわかりません。

 CLIからの使い方opencodeのみです。有料プランはないため、Grok Codeを無料で試せます。
https://opencode.ai/
公式サイトのトップに記載されている方法

もしくはmiseを利用していれば mise u -g opencode でインストールし

opencode

で開きます。
何も設定しなくてもモデル名にGrok Code Fast 1と表示されているため、このまま対話形式で利用可能です。

 エクステンションからの使い方IDEにエクステンションをインストール + 初期設定を行った後、モデルをgrok-code-fast-1に設定すればよいです。

Clineに関してはAPI ProviderがClineであるもの、Roo Codeに関してはRoo Code Cloud経由での利用のみが無料の対象です。

GitHub Copilotでは有料プランへの加入が必要です。

 使い方(実践編) - Grok Codeのプロンプトエンジニアリングガイドhttps://docs.x.ai/docs/guides/grok-code-prompt-engineering
xAIのサイトに、grok-code-fast-1のプロンプトエンジニアリングに関するドキュメントが公開されています。

前半のAgentic Coding Toolsを利用する場合の見出しを見ていくと
必要なコンテキストを与える
明示的な目標と要件を設定する
プロンプトを継続的に改善していく
Agenticなタスクを割り振る
とあります。
一般的なAgentic Codingにおけるベストプラクティスが記述されているようにも見えますが、特徴的なのは3番です。

Grok Codeが高速で安価なのを活かして、初回の失敗をもとに追加コンテキストを加えてプロンプトを洗練することが推奨されています。

ワンショットで完全なプロンプトを投入するのではなく、最初に大きくつくりあとから細かく改善していくような、いわゆる「イテレーティブでインクリメンタルな」開発を行うことがよいとされています。
まさにGrok Codeの「速くて安い」という2大特徴を活かした使い方です。

 つくったものopencode + Grok Code
https://beagleworks.github.io/Exchange-SI-FPS/
HTML+CSS+JavaScriptなシンプルな単位換算サイトを作成したところ、1～2分で完成しました。

あえて不向きなワンショットのVibe Codingスタイルを試してみましたが、このレベルであれば一発成功でした。

追加要件、READMEの作成も問題なくこなしました。そして早いです。

Grokもそうですが、日本語能力がかなり高いように思えます。
VSCode + GitHub Copilot + Grok Code
こちらでは、画像をコメントと共にアップロードして、ボタンを押すとマルチモーダルモデルに送り結果を受け取るといったアプリケーションを作成しました。
最初に要件を与えて設計書を作成させたあと、イテレーティブに指示を与えていくスタイルで作成しました。

なにかデータベースのテーブル設計の更新を忘れることが多かった気がしますが、都度不具合の修正指示を出して完成しました。

 利用コストの比較100万トークンあたりの料金比較です


モデル
入力料金
出力料金
キャッシュ入力料金


grok-code-fast-1
$0.20
$1.50
$0.02

qwen3-coder-flash
$0.30 ~
$1.50 ~
N/A

GPT-5 mini
$0.25
$2.00
$0.025

Gemini 2.5 Flash
$0.30
$2.50
$0.075

DeepSeek V3.1 Thinking
$0.135 ~ $0.55
$0.55 ~ $2.19
$0.035 ~ $0.14

Claude Sonnet 4(参考)
$3.00
$15.00
$0.30

GPT-5(参考)
$1.25
$10.00
$0.125

単体で見ても十分に安く、特にキャッシュヒット時の0.02ドル/100万トークンは破格です。
料金設定としてはqwen3-coder-flashを強く意識しているように思えます。

qwen3-coderは比較的安価(ただし欠点あり)でコスパが良いということで人気があるため、これに対抗する形で料金を設定したのかもしれません。

中華モデルに価格で挑んでいくのはなかなかのものですね…

他にもGPT-5 miniやGemini 2.5 Flash、DeepSeek V3.1 Thinkingよりも価格で優位に立っています。
※ qwen3-coderは入出力のトークン数が上がると単価が高くなるという残念な仕様があります。

 定量的な性能の検証出たばかりのモデルということもあり、少しずつ検証データが出始めた頃です。
https://eval.16x.engineer/blog/grok-code-fast-1-coding-evaluation-results
コード修正能力に長けていて、ゼロからの構築や特定分野(例えば今回はCSS)に関してはやや劣るといった感じです。

ゼロからの構築に弱いのはワンショットに向かないことはプロンプトエンジニアリングガイドでも触れられていたとおりです。

CSSに弱いのは、学習教材に偏りがあるのかもしれません。
https://github.com/laiso/ts-bench?tab=readme-ov-file
こちらはlaiso氏が管理する、AI Coding AgentのTypeScriptの能力を測るベンチマークです。

ここではGrok CodeはGPT-5相当となっており、かなり高い評価を受けています。

TypeScriptに関してはかなり学習しているのかもしれません。
(9/3追記)

https://artificialanalysis.ai/
こちらはArtificial AnalysisというAIの性能を測るサイトです。

grok-code-fast-1はCodingの部門で善戦しており、ここでもコスパの良さが伺える結果となっています。

ただ、このベンチマーク自体は参考程度に捉えるほうがよいとは思います。

 私の体感opencode及びGitHub Copilotで利用してみた感想です。

他のツールでは、もっと上手にGrok Codeを活用できる可能性もありますのでご了承ください。

コーディング速度は非常に速い

売りにしているだけのことはあります。
取りこぼしやうっかり壊す、がそこそこ見られる

コーディング性能は凡庸、特に優れているわけではない

やはり速度と品質はトレードオフとなります。

仕様変更があったのに、データベースのテーブルの更新を忘れるのはよくありました。

イテレーティブな指示が推奨されるのは、性能面での不安を補うためでもありそうです。

具体性のない指示でも、ある程度は理解してくれる

例えばエラーの内容を貼り付ける、起こっている問題を伝える程度でも十分に理解して修正してくれます。

問題を見つけて、修正する能力は比較的高いように思えます。

ドキュメントやツールの利用は上手く、まめである

何も言わなくても変更があればドキュメントを書き換える、Git管理であればcommitしてくれる、依頼すると上手にREADMEを作成するなどの特徴がありました。

Coding Agentにありがちな「ターミナルの扱いが拙くてスタックする」もありませんでした。

優秀なエンジニアの仕事を学習してきているのでしょう。

指示をしないとテストを行わない

中華モデルにもこの傾向がある気がしますが…テスト嫌いのようで、指示がないとテストを行いませんし、テストコードの作成も行いません。

恐らくテストに関しては、明示的な指示が必要です(未確認)。

こちらの相談にはあまり乗ってくれない

エンジニアリング自体に関する自然言語の知識はそこまで高くないように思います。

AIとじっくり対話しながら仕様書の作成から進めていくスタイルは向かないな、と感じました。

例えば技術選定に自信がないのであれば、事前に他のモデルに尋ねておくのがよいでしょう。

モノリシックなファイルを作成しがち

数百行～1000行に及ぶapp.pyやapp.js, style.cssを作成しています。

Agentic Codingの都合上ファイル数は少ないほうがよいのかもしれませんが、人間には扱いづらいものが出来上がっています。

イテレーティブな指示を行い続けることでファイルが肥大化するのは宿命とも言えます。

 私の結論単純な性能ではClaude Sonnet 4や中国の上位モデルと比べても遜色はなさそうで、何よりもコスパの高さは嬉しいです。

また速度は非常に速いので、超高速でサンプルを作成したい場合にも向いています。
一方メインで利用するには、もう少し工夫と検証が必要かもしれません。

できればテスト関連を含め、もう少し完成品の体裁が整うようにしてくれれば…と思います。
問題の修正能力やツールの利用、ドキュメントの生成力は高いので、例えばCodexのサブとしてピンポイントに利用する価値は十分にあります。

 まとめgrok-code-fast-1は今後も精力的にアップデートされる予定です。

ファーストリリースながらも、特に速さとコスパの面で優れ、将来性を感じさせる出来になっています。
実は当初の無料プロモーション期間は9/2までだったのですが、9/10までと1週間以上も延長されました。

(9/16追記：更に延長され、無料プロモーションの終了日は未定になりました)

WebのGrok4の無料開放もありますし、xAIは後発ながらもかなりの積極策に打って出て、他社を追随しています。
これを期にGrokのプロモーションの波に乗って、高速のAgentic Codingを体験してみるのもよいでしょう。

モデル	入力料金	出力料金	キャッシュ入力料金
grok-code-fast-1	$0.20	$1.50	$0.02
qwen3-coder-flash	$0.30 ~	$1.50 ~	N/A
GPT-5 mini	$0.25	$2.00	$0.025
Gemini 2.5 Flash	$0.30	$2.50	$0.075
DeepSeek V3.1 Thinking	$0.135 ~ $0.55	$0.55 ~ $2.19	$0.035 ~ $0.14
Claude Sonnet 4(参考)	$3.00	$15.00	$0.30
GPT-5(参考)	$1.25	$10.00	$0.125

GitHubで編集を提案

更新履歴

grok-code-fast-1とは？

使い方

IDEからの使い方

CLIからの使い方

エクステンションからの使い方

使い方(実践編) - Grok Codeのプロンプトエンジニアリングガイド

つくったもの

利用コストの比較

定量的な性能の検証

私の体感

私の結論

まとめ

Discussion