[2025年4月11日] MCPは道具へ、A2Aは言葉へ (週刊AI)
こんにちは、Kaiです。
相変わらずBigTechによる発表が相次いでいます。新しいモデルというよりも、基盤モデルを様々な形で応用していくためのプロトコルやフレームワークが中心的な動きになっているように感じます。基盤モデル競争はもちろん今後も続いていくでしょうが、エコシステムとして単体の基盤モデルではなく、様々なサービスやモデル間での協働を見据えた囲い込みが始まっていると思われます。
一方ユーザ目線で見ると、後述するFirebase Studioをはじめ、コーディングそのものは急激に民主化が進んでいます。すなわち、プログラミングのノウハウがなくても、アプリケーションやソフトウェアを作ることのできる世界が来ています。「そんなもの使えない」「運用や保守性なんか考えられていない」「最後はコードが書けなければ」といった意見も散見されますが、個人的にはそのレイヤーもAIが吸収できるだろう、と考えています。
とすると、何が残るのか。私は 「設計をすること」、すなわち作るものが満たすべき必要条件、十分条件、守るべき制約条件、そしてドメイン知識やユーザ体験を言語化すること、だと思っています。つまり、 「WhyとWhatの精緻な言語化」 です。その先は、恐らくAIが全て吸収できる日が来るでしょう。
これは、流行が加速しているMCPや後述するA2Aなどを触っていて、より強く感じるようになりました。MCPにより外部のサービスやデータへのアクセスが可能となり、それらに特化したLLM同士がA2Aで対話し問題解決にあたる世界が、容易に想像できます。
最終的には、人間の役目とは「解決されるべき問題を定義する」、すなわち 「AIに目的を与える」 ことになっていくのではないかと思います。その先に、「AIが自ら目的を定義する」世界が来たら……そのときは霊長の座をおとなしく譲り渡すときかもしれません。
と少しSF的な話になりましたが、今週のトピックスにいってみましょう。
注意事項
- 直近収集したAIおよびWeb系の記事やポストが中心になります
- 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
- 業務状況次第でお休みしたり、掲載タイミングが変わったりします
AI新着モデル、サービス、アップデート
OpenAI: 新モデルリリーススケジュール
GPT-5はより高性能にできる道筋が見つかったため、o3とo4-miniのリリースを先行するとのこと。数週間程度だとか。
OpenAI: ChatGPTがこれまでの全対話を参照可能に
これは強い。私も用途に応じて使い分けていましたが、チャットログが資産になるので移りにくくなる。ただ、エコーチェンバーも加速しそうな気もします。
GitHub Copilot: AgentモードとMCPサポートが全VSCodeユーザに
Cursorの牙城を崩すべく、MSも追従してきました。後述の通り、Googleも別の発想でこの領域に進出しており、今後の競争が注目されます。
(VSCode側発表)
(Github側発表)
(記事)
Google: Gemini2.5ProでDeepResearch可能に
一気に精度が上がりました。これはOpenAIのものとそん色ないか、上回っているかも。
Google: Agent2Agentプロトコル
仕様がデファクトになるかどうかはさておき、概念としては来るべきものが来た、という感じですね。MCPと同じ文脈で語られていることが多いようですが、これは「エージェント間の協働」を目的としたもので、大きく異なる世界観だと思っています。MCPが「AIが使う道具の仕様」であるのに対し、A2Aは「AI同士が対話するための仕様」という感じでしょうか。
(公式発表和訳) (試してみた)Google: Firebase Studio
新しい統合開発環境(のようなもの)を発表。AIがネイティブに組み込まれており、どうやらBoltなどのような「システム全体を一発で生成し、テストからデプロイまで実施」のような体験も含まれている模様。Cursorなどが、あくまで従来のIDEの拡張版として作られているのに対して、未来を見据えた異なる思想で作られているように思いますが、果たしてリプレイスなるか。
Claude: 新料金プラン「Max」
利用回数を大幅に増加させたプラン。どちらかというと、現在のClaudeは使用回数というよりコンテキストウィンドウの制約の方が気になっています。
Meta: Llama 4
ぬるっとリリースされてベンチも良い結果ですが、ベンチマークの結果を学習しているズルがあるのでは?という批判も出ているようです。実用面ではDeepSeekに及んでいないとの声も。
その他AI系話題
Cursor AIエージェントによる既存コードのアップデート戦略
やはり、既存コードベースの理解とノウハウのドキュメンテーションがカギですね。特に後者は、とにかく何でも(試行錯誤の経緯も)文字化しておくのが重要かもしれません。
「バグの特定や修正はAIの方が早い」──DMMがAIエージェント試験導入の結果を公開、評価は?
これはケースバイケースかなという気もします。普通にバグのあるコードをお出しされることもありますし、セルフチェックさせても検出できないときもあります。恐らく、「Web上に十分な知見がある言語、仕様で、一般的なユースケース」だとイケるという感じではないかなと思います。
DevinとClineをDMMで導入しました〜トライアルから見えた成果の共有〜
今目の前の効率化もそうですが、近い将来に必ず来るAIとの協働を見据えた組織づくりが必要なフェーズ。
Devinを使ったモバイルアプリ開発 - Devinはマルチプラットフォーム対応の銀の弾丸になりえるか -
こちらも同様に、銀の弾丸にはまだ足りない、という感じです。でも今から準備することに価値はありそう。
GitHub Copilot入門~Microsoft50周年で発表された最新機能まで!どこまでAI駆動で開発できるのか
復習とAgent含む最新機能の紹介。最後のGitHub Sparkも面白いですね。
QAエンジニアである私の「できたらいいな」を「できる」に変えてくれるCursorエディタ
このように、「ちょっとしたツール」などは、コードの知識が不足していても十分作れる世界になっています。
【東大理3合格】ChatGPT o1とDeepSeek R1に2025年度東大受験を解かせた結果と答案分析【採点協力:河合塾】
速報では出ていましたが、河合塾によるちゃんとした採点結果。いずれも理III合格水準(しかも上位)だそうです。理IIIに上位で受かる知能を使わない意味はない。
OpenAI SDKドキュメント日本語化(公式)
日本の内部エンジニアがこうして発信してくださるのは大変ありがたい。
LLMアプリの作成からテストとデプロイまで、LLMOpsの構築事例の紹介
MLOpsはManagedサービスもありノウハウも溜まってきていますが、LLMOpsはまだまだ発展途上なのでこうしてスナップショットのノウハウでも助かります。進化が速すぎて数か月後には別のアーキテクチャになってそうではありますが。
MCP関係
MCPは基礎的資料から応用事例まで、めちゃくちゃたくさん出ていたのでまとめてご紹介。個々のコメントは省略します。
基礎編
応用事例等
WEB開発系話題
高速なmemcached互換のKVSを開発した話
こういう地道なOSSがWebの基盤を支えています。ありがとうございます。
AWS Cognitoの罠10選
ああ!これはいい!Cognito簡単に使うにはすごく便利なんですが、ちょっと捻ると何か落とし穴がないか不安になるときもあるんですよね。チェックリスト的に使えそう。
その他一般テック話題
AI・LLM事業部プロダクト開発体制について
AIを作る、運用する部門の体制はどの会社も多分手探り。参考にします。
ChatGPTと1週間本気で語りあったら、いつか来てほしい未来が見えた
私の対話スタイルと全く違ったのでちょっと衝撃を受けてご紹介。常に課題を解決するために使っていたので、こういう対話をするという発想自体が私の中にありませんでした。
国立国語研、全文検索システム「ひまわり」のソースコードを公開
いいなと思ったんですが、営利目的は要協議、ですか……研究目的なので仕方ないとはいえ、ライセンスが明確なOSSを優先してしまいそう。
アプリを起動せずにアプリを開発して品質と生産性を上げる
結局、疎結合にして役割を分割し、テストを簡単にしましょうというお話なのですが、徹底できているかと言われると確かに微妙。
Discussion