🍌

Nano Banana Pro APIの新規機能は Gemini Web版で利用できるの！？ (Gemini 3 Pro Image)

2025/11/22に公開

!AIのはなしだけどAIでかいてないよ！

Googleのマニュアルを少し試してみたよ

 はじめにおひさしぶりです
ちょっと備忘録的に書きます、全部マニュアルに記載のある内容です！

ただ、自分用に残したかったので書きました

今までのNanobananaが出来ることに関しては今回触れません（反響あったら書くかもですがｗ）
マニュアルが主にAPIベースなので、

Geminiやaistudioとは仕様が異なる可能性があることはご了承ください

APIのマニュアルを元に、GeminiWeb版で確認できた項目は、各セクションに記載しています

2025/11/21現在の情報です

 NanoBananaProはどこでつかえるの？
 有料GoogleGeminiAIStudio

GeminiAPI

 無料/有料GeminiWeb版

※無料はレートリミット早いですが一応使えます

 NanoBananaPro の新機能一覧このZennをご覧の皆さんはごぞ時かもしれませんが、今回のアップデートはっきり言って

他の生成画像AIとは頭1つ出る内容でした
今回追加された内容が以下です
最大 14 枚の参照画像: 最大 14 枚の参照画像を組み合わせて最終的な画像を生成
高解像度出力: 1K、2K、4K のビジュアルを生成
高度なテキスト レンダリング: インフォグラフィック、メニュー、図、マーケティング アセット用に、読みやすくスタイリッシュなテキストを生成
Google 検索によるグラウンディング: モデルは Google 検索をツールとして使用して、事実を確認し、リアルタイムのデータ（現在の天気図、株価チャート、最近のイベントなど）に基づいて画像生成
思考プロセス: モデルは「思考」プロセスを使用して、複雑なプロンプトを推論します。最終的な高品質の出力を生成する前に、構成を調整するための中間的な「思考画像」（バックエンドで表示されるが、課金されない）を生成

 最大 14 枚の参照画像 （GeminiWebで一部確認済）今回のアプデで、NanoBananaは最大 14 個の参照画像可能です。

とはいえ、すべて人物を与えられるわけでありません。

これらの 14 枚の画像には、次のものを含めることができます。
最終的な画像に含める高忠実度のオブジェクトの画像（最大 6 枚）

キャラクターの一貫性を維持するための人物の画像（最大 5 枚）
仕様的に言うと、5枚なのでおそらく5人までは一貫維持して人物を保持できると読みました

また、人物以外のモノ・キャラなどをある程度高忠実にできるのが6枚なので6オブジェクトのようです
割とXでは賛否両論ありますが、一応マニュアルに定義されていました（人数やオブジェクト数ではないのでなんともいえませんが！）

 GeminiWeb6名までは破綻が殆ど無く読めてる感じは受けました

 Google 検索によるグラウンディング　（GeminiWebで一部確認済）なんとGoogle 検索ツールを使用して、天気予報、株価チャート、最近の出来事などのリアルタイム情報に基づいて画像を生成できるそうです。
ただ、本機能を利用する注意事項として
画像ベースの検索結果は生成モデルに渡されず、レスポンスから除外されます
Google 検索によるグラウンディングで画像のみモード（responseModalities = ["IMAGE"]）を使用すると、画像出力は返されません
要はToolsのGoogleSearchで画像検索をした画像検索結果は除外されるということのようです

 APIレスポンスレスポンスには、次の必須フィールドを含む groundingMetadata が含まれます。
searchEntryPoint: 必要な検索候補をレンダリングする HTML と CSS が含まれます。
groundingChunks: 生成された画像のグラウンディングに使用された上位 3 つのウェブソースを返します

 GeminiWebじゃあGeminiWebツールそもそも使えるの？というとこに至るんですが

GeminiWebでは以下のようなプロンプトを打つことで出来ました!!
明示的にプロンプトに記載すれば使ってくれるみたい？
この子をアナウンサーにして、東京都新宿の今現在の天気をアナウンスさせて
天候に応じた背景とキャラクターのモーションにして
今現在の天気は「Tools:google_search」を利用して取得すること

画像内にはテキストで今現在の天気に応じた「現在の年月日時、場所、天気、降水確率」を記載して
思考内容

実際の結果

なおぐぐると？あってそう！

SAGAバージョン

同じプロンプトで地域だけ変えました

なおぐぐると？降水確率がずれてるけど、リファレンスの違い？

 最大 4K 解像度の画像を生成　（GeminiWebで一部確認済）デフォルトで 1K 画像を生成しますが、2K 画像と 4K 画像を出力することができます！

高解像度のアセットを生成するには、generation_config で image_size を指定します。
なお、各サイズのKには大文字の「K」を使用する必要があります（例: 1K、2K、4K）。

小文字のパラメータ（例: 1k）は不承認です。
AIStudioの場合は以下から選択可能です

 GeminiWeb結論言うと指定できるけどDLが出来ないみたいな感じです
最初は指示と結果を指定
楽しくパーリナイしてる画像を作って
画像出力
aspect_ratio: 16:9
resolution: 4K

再度出力切替

行けてそう

再度出力切替

行けてそう

多少無視しますが再度プロンプトで指示すれば行けそうです

が！！

ダウンロードすると2Kはこえてるけど4Kにはとどいてない！

でもかわいいからいいや

 思考プロセス　（GeminiWebで確認）Gemini 3 Pro Image Preview モデル 通称NanobananaProは思考モデルです

複雑なプロンプトには推論プロセス（「思考」）を使用します
この機能はデフォルトで有効になっており、API で無効にすることはできません

思考プロセスの詳細については、Gemini の思考ガイドを参照
このモデルは、構成とロジックをテストするために最大 2 つの中間画像を生成します。Thinking の最後の画像は、最終的にレンダリングされた画像でもあります

最終的な画像が生成されるまでの思考を確認を確認できます

 GeminiWebなお、GeminiWebでも有効化されています

思考モードでプロンプト投げたら以下のようなのが出ますが、これが思考です

というか、思考プロセス中にバックグランドで中間画像画像作ってるんですね・・・

請求しないとはいえ、そりゃまあ高くなるわなー資源使うわなーと思います

 日本語の破綻の少なさGoogleは1つの要素として切っていませんが

日本語の破綻の少なさ

これがやっぱり今回の爆発の1つを担っていることは間違いないと思います

しないわけではないですが、殆どしないです

 総括しても～ゲームチェンジャーすぎます

多分アイディアがモヤっとしている人って結構世の中に居ると思っていて

それを本当にある程度形にできる

器用貧乏が器用富豪になれるのではないか！？そんな気がしました

ってかAIこえ～けどたのし～

 出典 と SpecialThanks
 出典Google APIマニュアル Gemini 3 Pro Imageの新機能

https://ai.google.dev/gemini-api/docs/image-generation?hl=ja#gemini-3-capabilities

 SpecialThanksキャラをお借りした方々

ぬこぬこさん

https://x.com/nukonuko

ニケちゃん/AIニケちゃん

https://x.com/tegnike

めいさん/桜草メイさん

https://x.com/mei_999_

大鹿ニクさん

https://x.com/M1RA_A_Project

山下さん/花音・クレア・トンプソンさん

https://x.com/0235_jp

えむげんさん

https://x.com/m_gen_chan

にゃぱん

https://x.com/nyapan_mohy
そして、AIニケちゃんDiscordサーバ参加者の皆様

 だそくもう半年後くらいにしごとなくなりそうだよ
サムネ作れるし

https://x.com/tegnike/status/1991620957170213062?s=20
LPもデザインカンプ案をつくれるし

https://x.com/nyapan_mohy/status/1991556549547028745?s=20
サガ紹介できるし

https://x.com/nyapan_mohy/status/1991573892859847124?s=20
マンガ書けるし

https://x.com/nyapan_mohy/status/1991540322162352149?s=20