[2025年7月4日] コーディングエージェントの協働が多分次のブレイクスルー (週刊AI)
こんにちは、Kaiです。
Claude Codeは毎週のようにアップデートされ、ノウハウもどんどん共有されています。最近の流行は、複数のエージェントを協働させる方向ですね。
特にHooksがリリースされてからは、終了時に自動的に他のエージェントを呼び出してレビューさせたり、追加の処理をさせたりといった使い方が出てきています。Claude Codeが自分自身を呼び出すと無限ループしてしまうため、多段階の処理をさせるにはよいノウハウだと思います。
また、o3とWeb検索を併用する使い方も紹介されていました。現状フロンティアモデル同士ではそれほど機能や味付けの差がありませんが、今後得意分野が分かれていくことも十分考えられますので、「Claude Codeを司令塔として各種エージェントをツールとして呼び出す」という使われ方が主流になっていくのではないでしょうか。
のちほど紹介するサカナAIの論文でも、協働によりパフォーマンスが上がるという報告がなされていますし、この方向性がコーディングのみならず、様々なタスクで活用されていくと思います。
さて、今回の冒頭ポエムは短めですが、トピックスいってみましょう。
注意事項
- 直近収集したAIおよびWeb系の記事やポストが中心になります
- 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
- 業務状況次第でお休みしたり、掲載タイミングが変わったりします
AI新着モデル、サービス、アップデート
Anthropic: Claude Code Hooks
アップデートで色々なイベントの開始時、終了時に確実にシェルコマンドを実行できるHooksが追加されました。タスク終了時に音を鳴らしたり、Slackに通知したりといった使い方が早速始まっています。
Anthropic: Claude Code Slash Commands Update
スラッシュコマンドも拡張された模様。Claude Codeのアップデートスピードと、開発者のかゆいところに手が届く感は割とすごいと思っています。
Claude Codeノウハウ等
登壇スライド作成もClaude Codeに任せたい 〜家でも外でも移動中も〜
コード以外でもClaude Codeを。ディレクトリ構成や指示ファイルの中身など、非常に詳しい記事です。そのまま流用できそう。
Claude CodeとGemini CLIで対話させると雑プロンプトでもかなりいい感じの出力が出る気がする
複数の異なるモデルを協働させるユースケースはこれから増えていくと思います。私もClaude CodeのコードをGemini CLIにレビューさせたりしています。
o3 MCPでClaude Codeが最強の検索力を手に入れた
こちらはClaude Codeにo3をツールとして使わせるユースケース。Web検索が可能になったことで、「分からないときはo3に聞いて」の有効性が非常に高くなっているようです。
Claude Codeの「すぐルール忘れる問題」を解決する超効果的な方法を見つけた気がする
これは確かに再帰的想起ができるので有効なのですが、トークン消費量(コンテクストウィンドウ圧迫)がちょっと気になるんですよね……。
Deep Dive into ~/.claude/projects
あー、ただの会話ログと思っていましたが、サブエージェントへの指示出しや挙動をトラックできるんですね。あれ?と思ったらちゃんと読んだ方がいいかも。
その他AI系話題
リソースとプロンプトを提供する MCPサーバ の作成
いつものnpakaさん。MCPサーバはツール以外にも「リソース」「プロンプト」が提供でき、そのサンプルを作っています。ほとんどツールとして実装されてると思いますが、この使い方も十分応用できそう。
Clineを200人で試してみた - モノタロウのAI駆動開発実践記
今の流行はClaude Codeですが、Clineとはいえこうして大規模にエージェントコーディングを導入したノウハウというのは応用可能なはず。参考になります。
限界まで実務で AI Agent 「Cursor」を使ってみたら、アイアンマンの気分になれた。まるでジャービス
Claude CodeによってCursorを使わなくなった、という方をちらほら見かけますが、このようにコーディングではなくAI統合エディタとして使う分には、相変わらず頼りになると思っています。
「生成AI」から「#生成UI」の時代へ。Vibe UI Codingでノリで自分好みのUIにする。
みんな大好きナル先生。Webサービスって最終的にはUIが消滅して、データAPIとMCPだけが残るのかもしれません。それぞれ自分好みのUIをその場で生成して使う世界。
生成AI活用の組織格差を解消する 〜ビジネス職のCursor導入が開発効率に与えた好循環〜
非エンジニアこそCursor使った方がいいと思ってる派ですが、なかなかハードルが高いのも事実。確かにこういう補助を入れてあげれば何とかなる人も増えそう。
「集合知」と「試行錯誤」によるフロンティアAIの推論時スケーリング
サカナAIから、フロンティアモデルを組み合わせることにより単体を大幅に上回るパフォーマンスを出せるという論文。冒頭にも書きましたが、これからはモデル協働が主流になりそうだと思っています。
AIでUIはどこまで作れる?UI自動生成ツール4つ実際に使って比較してみた
Stitch、v0、Visily、Uizardの比較記事です。これはありがたい!意外と味付けやサービスの方向性が異なることが分かります。
コードを1行も書かず本格的な”音声SNS”を10日間で作った話(セキュリティ面追記あり)
最後の方にありますが、「とりあえず動くものを作る」ことと「年単位で保守運用できるものを作る」ということには、かなり乖離がありますので注意が必要。ただ、プロトタイピングのコストが限りなくゼロに近づいているのは事実だと思います。
PJ-Aurora:メルカリにおけるUI生成・評価の取り組み
GoogleのADK事例あまり見かけませんでしたのでありがたいです。
Project Vend: Can Claude run a small shop? (And why does that matter?)
面白い実験です。Anthropicが、社内の自動販売機をClaudeに運営させてみた(仕入れや割引、在庫管理、利益管理も含む)というものです。結果は惨憺たるもので、人間に求められるままにクーポンを発行して赤字になったり、仕入れ価格の評価が誤っていたりといった感じです。ただ、特にチューニングをしていないようですので、「実際に運営ができた」という事実だけでもすごいことなのかもしれません。
Gemini CLIを会社で使う場合のプラン選択方針
Googleサービスの価格体系はちょっと分かりにくいことが多いので、こうしてまとめて頂けるとありがたい。
Gemini CLI のサンドボックス機能とは
おーこれは知りませんでした。この機能は強いですね、私が以前割とGemini CLIがコードベースを破壊すると書きましたが、これ知ってたらもっとうまく使えたかも。
なぜ今、研究者はGeminiを選ぶべきか?他のAIとの比較で見る10のメリット
研究者目線でのレビュー。確かに私もコーディング以外の目的で、チャットLLMを一つ選べと言われたらGeminiを選ぶかもしれません。
WEB開発系話題
JavaScript で Wasm 使ってるなら要注意! そのメモリ、本当に解放されてますか?
C++で作ったWasmをJavascript/Typescript側で利用する場合、明示的にメモリ解放を行わないとヒープメモリが溜まり続けるとのこと。いやこれは知らなかった。
今ならAmazon ECSのサービス間通信をどう選ぶか
網羅的に情報を整理し、現時点での選定基準を示してくれています。まずサービス間通信が不要な構成を検討し、どうしても迷ったらALBはまぁ、そうですよね……。
クッキーとセッション管理の理解を深める
非常に基礎的な内容ですが、復習にちょうどいいです。
Playwrightで実際のDBを用いてテストを並列実行し高速化する
これはいいですね。先日Claude CodeからPlaywrightのMCPを叩く記事をご紹介しましたが、併用できそう。
We are hiring!
私の所属するAI技術開発室では、AIを応用した医療系サービスを手掛けています。先日は以下の「CareNet Academia」をリリースしました。
積極採用中ですので、こういった医療xAIの領域に興味のある方は、是非以下からご応募ください!
Discussion