Googleの「バナナ」が画像編集の世界を変える?Gemini 2.5 Flash Imageの衝撃。ボディビルポーズで検証してみた
こんにちは!
今日は、2025年8月27日にGoogleが発表した、ちょっと面白い名前の画像生成AI「Gemini 2.5 Flash Image」について書きたいと思います。
実はこれ、「nano-banana(ナノバナナ)」という謎めいたニックネームで先に話題になっていたモデルなんです。
「AIで画像を編集する」って、もう当たり前だと思っていませんか?
最近は「AIが画像を生成する」「AIが写真を編集する」というニュースをよく聞きます。
もう慣れてしまったかもしれません。
でも、ちょっと待ってください。
今までのAI画像編集って、「髪型を変えてください」とお願いしたら、なぜか顔の輪郭まで変わってしまったり、「背景をぼかして」と頼んだら主役の人物まで変わってしまったり。そんな経験、ありませんでしたか?
つまり、AIは確かに画像を編集できるんですが、「あれ?これは私の写真じゃなくなってる...」という残念な結果になることも多かったんです。
なぜ「バナナ」と呼ばれていたの?
実は、Googleがこのモデルを正式発表する前から、「nano-banana」という名前で匿名でテストされていたんです。なぜバナナなのか、正確な理由は明かされていませんが、開発チームの遊び心が感じられますよね。
LMArenaという画像編集モデルのランキングサイトでは、このナノバナナが突如現れて、ぶっちぎりの1位を獲得したんです。
何がそんなにすごいの?
ここからが本題です。
Gemini 2.5 Flash Imageの最大の特徴は、「編集しても元の画像の本質が失われない」という点です。これを専門用語で「一貫性の維持」といいますが、ものすごくざっくりいうと、「あなたはあなたのまま、変えたい部分だけを変える」ということです。
たとえば、こんなことができます。
愛犬の写真に服を着せたくなったとします。普通のAI編集ツールだと、なぜか犬の顔まで変わってしまったり、体型が変わってしまったりします。でも、このモデルなら、愛犬はそのままで、服だけが自然に追加されるんです。
すごくないですか?
でも、完璧じゃないから面白い
とはいえ、完璧なツールというわけではありません。
微妙に顔が変わっていたり、表情が自然じゃないということは、何度か生成するとありえることです。
それでも、これまでPhotoshopのようなツールを使えないと出来なかったことが簡単に出来るようになったというのは、衝撃的な発展です。
実際の使い心地はどうなの?
開発者向けの話になりますが、1枚の画像生成にかかる費用は約0.039ドル(約6円)です。これは他社のサービスと比べてもかなりリーズナブルです。
そして処理速度も速い!
「Flash」という名前の通り、瞬く間に結果が返ってきます。
ユーザーからの反応も上々で、特に「複数の画像を自然に融合できる」機能が評価されています。女性の写真と犬の写真を融合させて、自然に抱き合っているような画像を作ることもできるんです。
ボディビルポーズで検証してみた
まず最初に、遊園地に遊びに行ったボディビルダーの画像を生成しました。
この画像を一貫性を保ったまま、ポーズを変えていきます。
プロンプト:キャラクターは同じでサイドチェストのポーズにしてください。
ほぼ完ぺきにキャラクターの一貫性が保たれています。
次に、別のポーズにしてみます。
プロンプト:キャラクターは同じでアブドミナルアンドサイのポーズにしてください。
これもキャラクターの一貫性が保たれています。
次は表情が変わるようなポーズにしてみます。
プロンプト:キャラクターは同じでモストマスキュラーのポーズにしてください
これも同じキャラクターのままだと言えると思います
次は背面を向かせてみます。
プロンプト:キャラクターは同じでバックダブルバイセップスのポーズにしてください
顔は見えませんが、一貫性が保たれているのではないでしょうか。
次に、横を向かせてみます。
プロンプト:キャラクターは同じでサイドトライセップスのポーズにしてください
あれ、ちょっと違う人になった
後ろを向いたら別人に入れ替わりました
前を向かせてみます。
プロンプト:キャラクターは同じでアブドミナルアンドサイのポーズにしてください。
あ、やっぱり別人になりました。
再度、写真を渡してアブドミナルアンドサイのポーズにしてみます
プロンプト:写真のキャラクターでアブドミナルアンドサイのポーズにしてください。
なんか足のポーズが変わりましたが、顔は一貫性が保たれています。
そして、背景は常に全く変わっていないところも驚異的です。
一貫性が保たれなくなったら、初期画像を渡すのが効果的ということも分かりました。
AIに「編集させる」から「一緒に創る」へ
よく「AIが人間の仕事を奪う」という話を聞きます。
でも、実際に使ってみると分かるんですが、AIは私たちの創造性を奪うのではなく、むしろ広げてくれるんです。
今まで技術的にできなかったことができるようになる。
そんな感覚です。
例えば、Photoshopが苦手な人でも、言葉で指示するだけでプロ級の編集ができます。
これは「技術の民主化」なんです。
というわけで、Gemini 2.5 Flash Imageは、単なる画像編集ツールではなく、私たちの創造性を解放してくれる新しいパートナーなのかもしれません。
もちろん、まだ発展途上の技術ですから、時々おかしな結果になることもあるでしょう。
でも、それも含めて楽しめる心の余裕があれば、きっと新しい表現の世界が開けるはずです。
興味がある方は、Google AI StudioやGemini APIで試してみてください。
Discussion