Gemini CLI キター!ので改めてAIコーディングエージェントの歴史を解説してみる【Gemini CLIのハンズオンあり】
👉 Gemini CLIの設定や使い方のハンズオン記事はこちら
コーディングエージェントの歴史
ChatGPTのリリースから、LLMによるコーディングを実践的に使いながら仕事をしているエンジニアの視点から、LLMとコーディングの歴史について語ります。
エディタ型エージェントと自律型エージェントの爆誕
Cursor(エディタ)の登場(2023/8月頃)
ChatGPTのリリースから、ここ2,3年で、エンジニアの働き方は急激な進化を遂げました。
その発端となったのが、Cursorやwindsurfのようなエディタ中心のツールです。
なぜCursorが流行ったのか
Cursorが流行したのは、VS CodeをForkして、エンジニアにとって馴染み深いUI/UXが維持されるという、導入のハードルの低さでした。
また、ユーザーからは、複数ファイルにまたがるコード生成機能「Composer」や、コードベース全体と対話できる「@Codebase
」、プロジェクト固有の指示を永続化する「.cursorrules
」ファイルなど複数の機能がリリースされ、当時の開発体験としては最高レベルだと評されていました(当時と言っても少し前のことですが)。
- https://blog.enginelabs.ai/cursor-ai-an-in-depth-review
- https://randomcoding.com/blog/2024-09-15-is-cursor-ais-code-editor-any-good/
Devinの登場(2024/12/10)
「世界初のAIソフトウェアエンジニア」という触れ込みで登場したDevinは、完全自律型のコーディングエージェントでした。
Devinの「Slackに召喚してチャットで指示を飛ばすことでコーディングやデプロイ」を行う様子は、たくさんの人が開発タスクを完全に委任できる未来を想像しました。
初期のユーザーからは、「まるで開発者と一緒に仕事をしているようだ」と、わずか2日間で完全なSaaSアプリケーションを構築できたといった驚異的な体験が報告されました。
しかし、現実は…満足に完了できたタスクはわずか15%
時間が経つにつれ、Devinが与えられたタスクを満足に完了できたのはわずか15%であったという分析結果が示されました。
根本的な問題はフィードバックループがないこと?
根本的な問題は、精度でなく、ワークフローでした。
自律性が、逆にエラーが解決できなくループに陥ることなどが発生する原因となりました。
現実的には、ユーザーとAIの間に、リアルタイムで壁打ちをしながら、フィードバックループで実装を進める必要がありました。しかし、Devinにはそれが無かったのです。
- https://www.theregister.com/2025/01/23/ai_developer_devin_poor_reviews/
- https://autogmail.com/devin-2025-test
- https://qubika.com/blog/devin-ai-coding-agent/
Roo Code(Roo Cline)の時代
mizchiさんの以下の記事がバズりましたね。
なお、Claude Codeに移行した模様。これについても後述してます。
Clineの哲学:「モデルではなく、アプローチに投資せよ」
開発者にとって最も根源的な環境であるCLIベースのコーディングエージェントも登場しました。
Clineの思想の核心は、「最高の」大規模言語モデル(LLM)は常に移り変わるという認識にあります。
そのため、Clineは開発者がOpenRouterのようなプロバイダーや直接のAPIキーを通じて、あらゆるモデルに自由にアクセスできる「薄く透明なレイヤー」として設計されました 。
以下の記事では最後のAIコーディングエージェントと言われています。
- https://www.reddit.com/r/CLine/comments/1k6yo0o/switched_from_cursor_to_cline_and_im_honestly/
- https://apidog.com/blog/what-is-cline/
Clineの発展
Clineは、RAGを使わず、代わりにLLMの巨大なコンテキストウィンドウと、ファイルシステムを探索し、ファイルを読み、コマンドを実行する能力に依存しました。
このアプローチはトークン消費が激しい一方で、大規模で複雑なコードベースを扱う能力で高く評価されました。
さらに、ClineはMCPを早期に採用し、SupabaseやAWSとの連携など、拡張性の高いエコシステムを築いていました。
しかし、コストの問題が残る
開発者は、APIキーの料金を直接支払い、タスクがどれだけのトークンを消費したかを正確に把握できました。
これは、一見すると、使った分だけ料金を支払うので、ツールのインセンティブとユーザーのインセンティブが一致すると思われました。
しかし、どれだけトークンを消費するかは予測不能です!
開発者によっては、一晩でCursorの月額料金(20〜50ドル)を消費したという報告や、アプリ開発に数百ドルを費やしたという声も上がっています。
これにより、Clineは非常にお金のかかるツールとなり採算が取れるか怪しく、さらに趣味で使う開発者には敷居が高いものとなりました。
- https://www.coplay.dev/blog/how-cline-quietly-changed-the-game-for-code-copilots
- https://news.ycombinator.com/item?id=44106944
- https://www.reddit.com/r/CLine/comments/1j9gt7f/how_much_do_you_need_per_app/
Webベースのコーディング(bolt,v0)
bolt, v0のようなWeb UIベースは今回省きます。興味のある方はこちら。
Claude Codeが盛り上がりを見せる (2025年5月)
2025年5月、Anthropic社がエージェントがコーディングエージェントの正解を出しました。
Claude CodeはCLIベースのツールであり、自由度が高く、かつ強力なインターフェースを備えています。
5月、6月はClaude Codeがバズり散らかしていましたね。
先述したmizuchiさん含め、Claude Codeへ移行するエンジニアが続出しました。私もClaude Codeにはかなりお世話になっています。
数ヶ月前まではエディタ型が最強と言っている方も…今はどうでしょうか?
CLIベースのメリット
CLAUDE.md
ファイルを使用し、これはCursorやClineのルールファイルと同様の役割を果たします。
また、手動でファイルを指定するのではなく、必要に応じてコードベースを自動的に探索します。
実装前に計画を立てる「探索、計画、コーディング、コミット」というワークフローが複雑なタスクにおけるパフォーマンスを大幅に向上させます。
料金体系
Claude Codeを利用する人が増えたのは、料金体系が鍵でした。
Anthropicのサブスクリプションプラン(Pro, Max)は、多少制限はあるものの、従量課金でないため、強力なモデルへの実質的な無制限アクセスを提供するため、コストパフォーマンスが高いと評判でした。
- https://www.thoughtworks.com/en-us/insights/blog/generative-ai/claude-code-codeconcise-experiment
- https://www.reddit.com/r/ClaudeAI/comments/1kz095d/seeking_advice_on_claude_code_vs_cline_and/
Gemini CLIの衝撃
Googleは2025年6月25日、Geminiのパワーを開発者のターミナルに直接もたらすオープンソースのAIエージェントとして、Gemini CLIを発表しました。
コーディングに秀でているだけでなく、コンテンツ生成、リサーチ、タスク管理など幅広い用途に対応する「多目的ローカルユーティリティ」として位置づけられています。
-
モデル: 巨大な100万トークンのコンテキストウィンドウを誇るGemini 2.5 Proを搭載。
-
環境: 主にTypeScript(95.1%)で書かれたターミナルネイティブなツールで、プロンプトからモデルへの軽量かつ直接的なパスを提供します。
-
ライセンス: Apache 2.0ライセンスの下で完全にオープンソース化されており、コードはGitHubで公開されています。
-
拡張性: カスタムツールを追加するためのModel Context Protocol(MCP)を標準でサポートし、Google検索によるリアルタイム情報の参照(グラウンディング)も可能です。
-
カスタマイズ: プロジェクトディレクトリにGEMINI.mdファイルを置くことで、挙動をパーソナライズできます。
無料枠がある
個人のGoogleアカウントで利用する場合、Gemini CLIは完全に無料です。これにはGemini 2.5 Proモデルと100万トークンのコンテキストウィンドウへのアクセスが含まれ、利用上限は毎分60リクエスト、毎日1000リクエストという非常に寛大な設定です。
なぜClaude Codeよりも優れていると言えるか
Gemini 2.5 Proは100万トークン(将来的には200万トークン)のコンテキストウィンドウを提供する一方、最新のClaude 4モデルは20万トークンのウィンドウを備えています。これは生容量で5倍の差です。
コンテキストウィンドウが大きいと、LLMがコード全体、複数の巨大なファイル、広範なドキュメンテーションを一度に読み込み、その上で推論することを可能にするため、大規模なリファクタリング、複雑な相互依存関係の理解、新しいプロジェクトの実装などあらゆる場面で効いてきます。
実際に、ClaudeのWeb UIとGeminiのWeb UIのCanvas機能で試してみても、圧倒的にGeminiが生成するコードのクオリティの方が高いです。
- https://blog.google/technology/developers/introducing-gemini-cli-open-source-ai-agent/
- https://www.datastudios.org/post/chatgpt-vs-google-gemini-vs-anthropic-claude-comprehensive-comparison-report-capabilities-perfo
終わりに
Gemini CLIの登場以前は、開発者の選択肢は「予測可能だが限定的(Cursor)」か「強力だが高価(Cline/Claude Code API)」の二者択一でした。
Gemini CLIは、「強力さ(Gemini 2.5 Pro, 100万トークンコンテキスト)」と「予測可能性(非常に高い上限まで無料)」の両方を提供します。これにより、競合他社は自社の価値提案を再定義せざるを得なくなりました。もはや強力なモデルへのアクセスだけでは競争できません。
今後どうなるのでしょうか…。
👉 Gemini CLIの設定や使い方のハンズオン記事はこちら
Discussion