[2025年11月21日] AIビッグウィーク:Gemini3.0、GPT-5.1Pro、Nano-banana Proなど (週刊AI)
こんにちは、Kaiです。
いやもう本当に発表固めるのやめてほしい。
まだろくに比較検証も出来ていないので、今回のポエムは短めでいきます。皆さんもこんなポエム読むより早く触った方がいいです。
GoogleからはGemini3.0とIDEのAntigravityが公開され、今のところは誰でも無料で使えるようです。Googleの凄まじい資本力と賭けている感が伝わってきます。ここで注目なのは、「事前学習スケーリングでまた新たな進歩があった」としている点です。ここ最近は事前学習のスケーリングはほぼやり尽くされ、事後学習と推論のスケーリングに焦点が移っていましたが、まだまだ事前学習でも改良の余地があるということのようです。
そしてそれに対抗するようにGPT-5.1Proとコーディング特化のGPT-5.1-Codex-Maxが公開。どちらも試していますが、結構方向性が違うなと感じています。これは後述します。
さらにさらに、対向するようにNano-banana Proが公開。これはすごいです。完全に画像生成の領域では一つ頭を抜けた感じがあります。というかもう画像や図を作るタスク全部これでいいんじゃないかな。
一方で、この週もっとも早く公開されたGrok4.1は、全く別の方向性、すなわち「NSFWを含む、何でもアリ」な世界観で戦っています。ここで書くのは憚られますが、流れて来る生成例を見ていると、ここまでやっていいのか?本当に?という印象を持ってしまいます。ある意味で唯一無二な存在になっていると言えるでしょう。
さて、Gemini3.0とGPT-5.1Proですが、私が触った感覚では「即座に頭のいい回答を返すGemini3.0」と、「じっくり考えて深い洞察を返すGPT-5.1Pro」という感じです。GPTの方はとにかく時間がかかりますが、考察の内容やロジックに情報を精査して熟考した形跡を感じました。一方のGemini3.0は、頭のいい博識な人が打てば響くような回答している印象です。
割と近いことを表明している方もいて、以下のデータによるとGemini3.0はハルシネーションが多い(減らす努力を恐らくあまりしていない)のに対し、GPTやClaudeは「分からない」と答えられることでハルシネーションを減らしているというような話もあります。
また、Gemini3.0とGPT-5.1Proを直接的に比較した方の記事は以下になりますが、この方の所感は私のものにかなり近くなっています。
さらに、Claude 4.5 Opusが公開準備に入ったという噂もあります。もう何が何やらという感じですが、三連休もありますので腰を据えて試してみたいところです。
では今週のトピックスです。
注意事項
- 直近収集したAIおよびWeb系の記事やポストが中心になります
- 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
- 業務状況次第でお休みしたり、掲載タイミングが変わったりします
AI新着モデル、サービス、アップデート
OpenAI: GPT-5.1Pro & GPT-5.1-Codex-Max
Gemini3.0と同じ週に発表。サム氏が余裕の態度だったのはこの弾があったからですね。それにしても同じ週にぶつけるのは本当にやめてほしい。ただ、サム氏はその後「Googleに追い越されたかもしれない」という趣旨のことを言っているらしく、競争環境の変化に注目です。
Google: Gemini3.0
普通にめちゃくちゃ賢いし、速いですね。冒頭に書いた通り、GPTとは使い分けが必要だと思います。ただ無課金のGPTよりは確実によいと感じています。 (解説、所感など)
Google: 新IDE「Antigravity」
Windsurfのラッパーと噂されているIDE。ちょっとまだ触れていませんが、今のところ無料で使い放題というのが凄まじい。あと、Nano-bananaと併用すると実質的にAI画像エディタとして機能するようです。 (解説、所感など)
Google: nano-banana Pro
ちょっとこれは群を抜いてすごい。
「理系の高校生向けに、圏論を概念的に説明するインフォグラフィック画像を作って」でこれが一発生成されました。これまで不得意だった図示や文字が、人間の目で見てほぼ違和感ないレベルに達しています。プロンプトを変えながらガチャれば、ほぼ全てのニーズに対応できるのでは。

xAI: Grok 4.1
「無法地帯」として独自の立ち位置を確立したGrok。マスク氏は人類にカオスをもたらしたいと思っている、というのが私の予測なのでまぁ当然かも。
Meta: Apache2.0ライセンスで1600言語対応の音声認識AI
最近AI領域であまりMetaの名前を聞かなかったのですがこれはなかなか。5000言語以上にも対応可能ということで、「人類の言語」に共通する特徴を学習できたのかもしれません。
Microsoft: MCP on Windows
ついにWindowsにもMCPが。OSレベルとなるとガードレール、セキュリティがめちゃくちゃ大変な気がしますが、その辺りどう対策してくるのか。
その他AI系話題
Anthropic社の「Code Execution with MCP」が示す未来 ―― ツールコール時代の終焉と、エージェント設計の次
MCP設計について重要な観点。確かに、コンテキストを圧迫するような旧設計のMCPは今後淘汰されていきそう。
チームのCLAUDE.mdが勝手に育つ - Hook機能での自動化
手動で指示していましたが、自動化できるのはいい。一方で指示ドキュメントをチームで共有するやり方についてはまだベストプラクティスが確立されていないと感じています。
ローカルLLMのPoCに300万円使う前に読んでほしい話
「ローカルで使えるLLMをデプロイしたクラウドサービスに、オープンデータや匿名化データを流し込んで検証」というのはいい方法です。私たちのチームもこういう手法を取ることがあります。
わいの生成AIがカスコードばっか出してくるんやが
これは一理あるのですが、既にプロンプトを工夫する段階は割と過ぎていて、どのように必要な情報をドキュメントとして整備できるか、渡せるかに勝負が移ってきている気がします。プロンプトの外部化とでも言うんですかね。
AIサイエンティストKosmos
これまでのものとは一線を画す性能で、1度の研究実行で1500本の論文を読み4万行以上の検証コードを書いて、人間の研究者の6ヶ月程度の成果を1日で出せる見込みとのこと。既に未公開の人間による研究成果をいくつか独自に再現しており、未知の発見にも貢献したそうです。
仕様駆動開発の理想と現実、そして向き合い方
そうなんですよね。SDD単体ではレビューコストが爆発するだけ。Specからテストの生成がキモだと思っており、試行錯誤中です。
WEB開発系話題
標準の Web API で URL のパターンマッチングを処理する URLPattern
結構自前実装してしまうこともありますが、こうして標準化されたものを使えるならアリ。
その他一般テック話題
Cloudflare障害ポストモーテム
11月18日に発生したCloudflareの大規模障害の振り返りが早速公開されています。根本原因は、DBの権限設定の変更ミスだそうです。
We are hiring!
私の所属するAI技術開発室では、AIを応用した医療系サービスを手掛けています。先日は以下の「CareNet Academia」をリリースしました。
積極採用中ですので、こういった医療xAIの領域に興味のある方は、是非以下からご応募ください!
Discussion
今週は本当に大変でしたね。毎週まとめてくださってありがとうございます。