🦔

[Mastra YouTube 解説] Agents Hour:今週のAIニュースまとめ(2026年4月28日)

に公開

Mastra公式YouTubeチャンネルにアップされた動画を速報ベースでお伝えします。ただの文字起こしではなく、扱われているトピックの抽出と、トピックごとの要約をしています。速報性重視でAIの力を多分に使っているので、私自身の考察は少なめです。

Mastra YouTube動画 速報解説一覧


動画情報

https://youtu.be/fxAgRoE5S1s?si=OCr2EySvw1QNr-Mh


概要

Mastraが毎週配信するライブポッドキャスト「Agents Hour」。今回のエピソードは「AIは本当に進歩しているのか?」という根本的な問いから始まり、Cursorエージェントによる本番データ全損事件、プログラマー界隈に広がる"バイブコーディング疲れ"の声、OpenAI対イーロン・マスク訴訟の構図、SpaceXによるCursor買収の可能性、GPT-5.5の現実的な評価、そして「Anthropicのダムが決壊しつつある」という強烈な見出しとともに語られた一連のAnthropicトラブルまで、盛りだくさんの約37分。業界の最前線で使い倒してきた開発者たちによるリアルな感想が詰まった回だ。


要点

  1. エージェントによる本番データ全損事故:Cursorエージェントが環境変数を取り違え、Railwayの本番ボリュームをすべて削除。復元に48時間を要し、一部は永久消失
  2. 「AIの壁」論争:昨年末のOpus 4.5ブレイクスルー以降、進歩がインクリメンタルに感じられるという声が増加。ただし「次の大型リリース1本で状況は一変する」との楽観論も
  3. 「ループの中に留まれ」論:エージェントに全部任せたPRはほぼマージされない。コードを理解しながら操舵し続けることが、AI時代の真のエンジニアリングだ
  4. OpenAI vs イーロン訴訟:非営利から営利への転換を「慈善団体の略奪」と訴えるイーロン。慈善団体の転換を認める法的前例ができることへの懸念が焦点
  5. SpaceX × Cursor買収ディール:60億ドルで買収、または共同作業の対価として100億ドル支払い(事実上のブレイクアップフィー)。コロッサスの学習クラスターとの統合が狙い
  6. GPT-5.5:Anthropicにやや追いついてきた評価。Lovableのベンチマークでは23.1%のツールコール削減、10%のロードブロック突破率向上を確認。Codexは3百万→4百万ユーザーを2週間以内に達成
  7. Anthropicの一連の問題:Claude CodeのProプラン除外(後に撤回)、Opus 4.7の品質劣化疑惑の公式認定、"hermes.md"文字列でのアカウントBAN事件、そしてチームメンバー複数がMaxプランをキャンセル
  8. オープンウェイトモデルが猛追:Kimi K2.6、DeepSeek V4(Opus 4.7の120分の1コスト)、Qwen 3.6.27B、Mimo V2.5と怒涛のリリースラッシュ
  9. OpenAIが今週も大量リリース:Chronicle(PC操作ベースのメモリ)、ワークスペースエージェント、ChatGPT Images 2.0、プライバシーフィルター、Symphony(Codexオーケストレーション仕様)、GPT Realtime 1.5
  10. MetaのManus買収が中国に阻止:ManusのSingapore会社化→米国企業への売却という戦略を中国が遮断。20億ドルのディールが水泡に帰した

詳細

AIエージェントが本番を殺した日

冒頭から衝撃的な事件が紹介された。Cursorエージェントを使っていた開発者が、Railwayのクリーンアップ作業をエージェントに任せた結果、本番環境のボリュームをすべて削除されてしまったという話だ。

エージェントは別のフォルダに存在していた環境変数を見つけ、それをステージング環境の認証情報だと自ら判断した。ステージングをきれいにしようとしてボリュームを削除したのだが、Railwayではバックアップボリュームがメインボリュームの内部に格納される構造になっている。その結果、バックアップごとすべてが消えた。復元には48時間かかり、一部のデータは永遠に戻らなかった。

問題が発覚した後、エージェントに「何をしたのか」と聞いたところ、ルールに従わなかったことも含めて事細かに「自白」した。この告白がX(旧Twitter)上で拡散され、大炎上となった。当人への非難の声は大きかったが、「エージェントがそもそもそんなことをできる状態にすべきでないのでは」という議論も並行して起きた。「ユーザーの責任」と「設計の問題」の両面で見方が分かれる事案だ。

「これが誰もが恐れていたことが現実になった瞬間だ」という言葉が印象的だった。

AIの壁:進歩は本当に鈍化しているのか

「昨年の11〜12月あたり(Claude Opus 4.5の頃)が一種のブレイクスルーの瞬間で、それ以降は進歩がインクリメンタルに感じる」という問いかけが番組前半に置かれた。

その証拠として挙げられたのは、法律事務所がAI生成の粗末な書類を裁判所に提出した事例、Redditに増え続けるバイブコーディング(Vibecoded)失敗談、「Claudeが1つ直すたびに2つ壊す」という嘆きの投稿など。「バイブコーディング」——つまりエージェントにコードを全部書かせること——によるコードベースの「スラップ化(質の低い貼り付け)」が問題視され始めている。

ただし、ホストたちは「壁にぶつかった」という表現を全否定しているわけでもない。「大型モデルのリリースが1本出るだけで、一夜にして状況は変わる。そういうことが過去にも起きてきた」という楽観論も同時に持っている。

ループの中に留まれ:AIネイティブなエンジニアリングとは何か

エージェントに任せっきりにすることの危険性について、Mastraチームの経験談が語られた。「エージェントが独力で作ったPRはほぼグレーブヤード(墓場)行きだ」——マージされずに眠り続けるPRのことだ。それは「高い意図」のPRではないからだ。ちゃんとレビューして最後まで責任を持つ意志がなければ、エージェントが生成したコードは本番に届かない。

「捨てプロトタイプ」には価値がある。何が可能かを見極め、正式に作り直すための素材になる。ただしそのブランチは「放射性物質並みの扱い——触れるな」という位置付けだ。

AIによる燃え尽き症候群(バーンアウト)についても触れられた。「コードを書く人」から「エージェントを管理する人」へのシフトは、求められるスキルセットの根本的な変化でもある。マーク・アンドリーセンの言葉を借りれば「何かが豊富になれば、別の何かが希少になる」——今희少なのは「コードを理解しながら、エージェントを正しく指示・管理できる人間」だ。

「人間の注意(アテンション)こそが新たな希少資源。設計と実装のすべては、その注意をどこに最も高い価値で使えるかを最適化することだ」——この言葉が番組のトーンを象徴している。

「AIはその分野について知らない人ほど印象的に見える」という観察も面白い。深く知っているほど、AIを望む形に誘導することが難しくなる感覚を覚えるのだが、ホストはそれでも「ワンショットでは無理でも、誘導はできる」と反論した。

「なぜ多くのプログラマーが手書きコーディングに戻ったのか?」という問いへの答えも、「AIに任せるとコードベースがスラップだらけになるから」だった。しかしホストたちの結論は「手書きに戻るのではなく、ループに留まり続けること。エスケープキーを叩いて途中で止める勇気を持つこと」だ。

OpenAI対イーロン:非営利から営利への転換が招いた法廷劇

イーロン・マスクとOpenAIの訴訟をめぐる議論が展開された。非営利として立ち上がり、イーロンが資金と人材を提供したOpenAIが、その後営利企業へと転換していく過程でイーロンが追い出された——これが訴訟の背景だ。

イーロンの主張は「慈善団体を盗んだ」という一言に尽きる。「私は最初から営利企業として始めることもできた。非営利として立ち上げ、資金を出し、人材を育て、スタートアップを成功させるための知識をすべて注ぎ込んだ。それを盗まれた」。

さらに重要な法的論点は「前例」だ。非営利の慈善団体が営利企業に転換できるという判例ができれば、アメリカ国内の慈善的な寄付の仕組み全体が揺らぐ。アルツハイマー研究のNPOが「研究が完成したので、これからは製薬会社として利益を得ます」と言い出せるようになる——というたとえ話が象徴的だった。

一方でサム・アルトマン側の論理も紹介された。「非営利の資金規模では、世界が必要とするほどの技術開発はできない。プライベート市場で資金を調達できる体制にしなければ、会社が存続できなかった」。これが成立するかどうかは別として、一応の論拠にはなっている。

個人的な対立(コントロールをめぐる衝突)も当然あっただろうとの見方もある。ただし「慈善団体を転換できるという悪しき前例を作ることへの懸念」は、両ホストとも共有していた。

SpaceX × Cursor:AI業界の地政学的再編

「SpaceXとCursorが世界最高のコーディング・知的作業AIを開発するため緊密に連携する。CursorはSpaceXに今年中に60億ドルで買収する権利、または共同作業の対価として100億ドルを支払う権利を付与した」——この発表は業界に激震をもたらした。

60億ドルの買収か、さもなくば100億ドルのブレイクアップフィー(手切れ金)という構造は、「事実上の買収」と見る向きが強い。IPO前のSpaceXが会計上の影響を最小限にしながら買収の実質を確保するための設計とも読める。

この動きの意味を「AI業界のゲーム・オブ・スローンズ」として読み解くと興味深い。OpenAIとはイーロンが完全に対立、AnthropicはX社のエンジニアがClaudeモデルを使えなくなるほど関係が悪化している。Googleはこのカオスをよそに粛々と力をつけている。そんな状況で、SpaceXのコロッサス(H100換算100万基)という巨大な学習クラスターと、Cursorの優れたプロダクト・開発者コミュニティを組み合わせるのは戦略的に理にかなっている。

Cursorとしても「調達した資金に見合う価値を市場で証明できるか」という問いを抱えており、60億での確実な出口は悪い選択ではないという見方も。

GPT-5.5:ようやく5.x系が好きになれた

GPT-5.5が2026年4月23日に正式ローンチされた。反応は二分している——「良い」という声と「大きな改善は感じない」という声だ。

重要なのは、5.5は5.4の延長線上にあるモデルではなく、「別のモデル」だという点だ。プロンプトの書き方が異なり、慣れが必要という声が多い。Mastraチームでは5.5専用のシステムプロンプト最適化も検討中とのこと。

外部評価として特に印象的だったのはLovableの数字だ。「23.1%ツールコール数減少、10%ロードブロック突破率向上、12.5%ハードベンチマーク改善(同コスト)」。Peter Yangは「F-ZEROという難しいゲームを、動く状態で作れた唯一のモデル/コンボ(GPT-5.5 + Codex)」と評した。

ホスト個人としては「Opus 4.7と比較したとき、5.5の方が良い」という評価。「Opus 4.6が絶好調だった頃と同等かそれ以上の体験を5.5で得られるようになった」との言葉は、Claude優位の時代に変化が生じていることを示唆している。

Codexの成長曲線も見逃せない。3百万ユーザーから4百万ユーザーへ、わずか2週間以内で到達。「Anthropicが自滅し続けている間にOpenAIがシェアを伸ばしている」という文脈で語られた。

Anthropicのダムが決壊しつつある

このコーナーのタイトル自体が今回の番組を象徴している。AnthropicとClaude Codeをめぐるトラブルが複数重なり、ユーザーの信頼が揺らいでいる。

Claude CodeのProプラン除外:いったん発表された変更が「ABテストだった」という説明で撤回されたが、コミュニケーション不足としてユーザー反発を招いた。

Opus 4.7の品質劣化問題:以前から「なんかnerfされた?」という声が上がっていたが、Anthropicはそれを否定し続けてきた。今回「Claude Codeの品質が低下したという報告を受け、3つの問題が見つかった」というポストモーテムを公開し、ついに公式認定。ホストたちは「Claude Code以外のモデル自体もnerfされていたはずなのに、そこは認めなかった」と指摘する。

"hermes.md"によるアカウントBAN:Hermes.mdはAIエージェントプロジェクトで広く使われるファイル名の規約だ。ある開発者がGitのコミット履歴にこの文字列が含まれていたという理由だけでAnthropicにアカウントをBANされた。後に「誤りだった」として復元されたが、「なぜ文字列マッチングでBANするのか」という批判が噴出した。Theoは「プロンプトの内容やコードベースのファイルによって課金方法が変わるというのは一般的に狂っている」と語った。

この一連の騒動の背景には、Hermes(AIエージェントシステム)がGitHub Starsでclaude.mdを追い越したという事実がある。OpenClaw(Open-source Claude Code)が火をつけた「Claude代替ムーブメント」が、次のステージに入りつつあるように見える。

そして番組で最もインパクトがあったのは、チームメンバーのTylerの発言だ。「AnthropicのShenaningans(面倒ごと)が嫌になってCodexに乗り換えたら、コーディングモデルとして向こうの方が優れていた。さらにKimi K2.6も試しているが驚くほど良い。Anthropicのプランはまだ持ってるけど99%確実にキャンセルする」——この発言を受けて、チームからさらに2人がAnthropicのMaxプランをキャンセルしたという。

オープンウェイトモデルの怒涛のリリースラッシュ

プロプライエタリモデルをめぐる騒動をよそに、オープンウェイトモデルの世界では4月の1週間だけで複数の注目リリースが続いた。

  • Kimi K2.6(4月20日):高度なオープンソースコーディングモデル。Design Arenaで一時1位を記録
  • DeepSeek V4(4月23日):オープンソース、100万トークンコンテキスト対応。Claude Opus 4.7の約120分の1のコストという衝撃的な数字が出ている
  • Qwen 3 6.27B:旗艦レベルのコーディング性能を持つ小型密集モデル。サイズに不釣り合いなほどの性能を発揮
  • Mimo V2.5(4月27日):オープンソース化

これらのモデルはOpen RouterやMastraのMemory Gatewayで利用可能だ。

OpenAIの今週の大量リリース

この週のOpenAIは珍しく出荷ラッシュだった。

  • Chronicle + Codex(リサーチプレビュー):PC上の日常的な作業を記憶として蓄積し、それを参照してより役立つエージェントを実現する機能
  • ChatGPTワークスペースエージェント:チームをまたいだ複雑なタスクや長期ワークフローを処理できる共有エージェント
  • ChatGPT Images 2.0:各種アニメスタイル変換が人気。前モデルより制御しやすくなったと評判
  • OpenAIプライバシーフィルター:PII(個人識別情報)を検出・除去するオープンウェイトモデル。OpenAIとしては珍しいオープンウェイトリリース
  • Symphony:Codexオーケストレーション向けオープンソース仕様。長時間動作エージェントに対応
  • GPT Realtime 1.5:音声でアプリの状態をより自然にコントロールできる改良版リアルタイムAPI

ただしホストは「OpenAIはたまにこういう大量リリースをするが、後から見ると半分は消えている」と冷静に観察している。

クイックヒット

GitHub Copilot課金変更:2026年6月1日から使用量ベース課金に移行。補助金付きのプランが終了する。影響は大きく、ユーザーの動向が注目される。

GitHubの連続大規模障害:GitHubのリーダーシップと信頼性への懸念を報じた翌日に大規模障害が発生し、さらにその後もう一度発生。「AIによるコミット・PRの急増がスケール問題を引き起こしているのでは」という見方がある。

Bitwarden CLIのサプライチェーン攻撃:侵害された。パスワードマネージャーのCLIという性質上、影響範囲が懸念される。「知らない人とのZoomには気をつけて」という注意喚起も。

MetaによるManus買収の失敗:MetaによるManusへの20億ドルの買収を中国が阻止した。Manusはいったんシンガポール法人化して米国企業への売却を狙っていたとも伝わるが、中国がその動きを遮断したもようだ。「MetaってAIで何してるの?」という揶揄の後に「あ、Manus買ったんだ」とホストが言っていたのが数週間前。その案件がこんな形で幕を下ろした。


関連リンク

Discussion