🖼️
Gemini 2.5 Flash Image モデルが発表されました!!
Gemini 2.5 Flash Image モデルが 2025/08/27 に発表
Gemini 2.5 Flash Image -> 2.0 Flashからの進化と新機能紹介!
主な進化点と新機能は以下の通りとのこと!ぶっちゃけ何が変わったの?ということで、見てみました。
個人的に手書き認識がおおおおおおお!!となりました!私の画力が試されずに、その場で説明資料ができてしまうかもしれないということですね。
-
最先端(SOTA)の画像生成と編集
Gemini 2.0 Flashの基盤の上に、より高品質な画像生成と強力なクリエイティブコントロールを提供したそうです!アップデートですね。 -
マルチイメージフュージョン
複数の異なる画像をシームレスに一つの新しいビジュアルに統合できる機能が加わりました。マーケティングや広告などで、複数の参照画像を用いて統一されたビジュアルを効率的に作成できます。 -
キャラクターとスタイルの統一性
複数の生成や編集を通じて、同じ被写体やビジュアルスタイルを一貫して維持することが可能になりました!これで変に登場人物が増えなくなりましたね。 -
高度な対話型編集
シンプルな自然言語の指示による画像編集に加え、より自然な対話を通じて画像を思い通りに調整できるとのこと!!何回も修正依頼をかけて OK ということですね! -
ネイティブな世界知識の活用
手描きの図の理解や、より複雑な編集指示への対応など新しいユースケースを可能にするとのことで・・・手書きの絵も理解できる世界になってきました。これは使わねば!! -
責任ある利用のためのSynthIDウォーターマーク
Gemini 2.5 Flash Imageで作成または編集されたすべての画像には、目に見えないSynthIDデジタルウォーターマークが埋め込まれます、とのこと。セキュリティバッチリですね。
参考
* https://developers.googleblog.com/en/introducing-gemini-2-5-flash-image/
* https://cloud.google.com/blog/products/ai-machine-learning/gemini-2-5-flash-image-on-vertex-ai
Gemini 2.5 Flash Image:利用方法と価格
項目 | 詳細 |
---|---|
利用状況 | 現在、プレビュー版として利用可能 |
アクセス方法 | Vertex AI(企業向け) Gemini API(開発者向け)Google AI Studio(開発者向け) |
価格(出力トークンあたり) | 100万出力トークンあたり30.00ドル |
価格(1画像あたり) | 1290出力トークンに相当し、0.039ドル/画像 |
実行してみた
VertexAI Studio より
-
元画像
プロンプト
Add some chocolate drizzle to the croissants. Include text across the top of the image that says "Made Fresh Daily".
プロンプト
And Some crispy donuts in the picture !
対話形式で、とってもカロリー爆弾なクロワッサンとドーナッツたちが出来上がりました!
Google AI Studio より
森でただずむ私が出来上がりました!違和感がないです!!!
まとめ
手書き版が Preview でなくなったら個人的にタブレットで使いたいと思いました!
まさか対話形式で画像が生成できたり、森に佇む私が作れたりとは思いませんでした・・・。
ぜひぜひ試してみてください!
参考になりましたら嬉しいです。
Discussion