👋

Googleの最新AI画像生成は、Googleアカウントさえあれば誰でも今すぐ試せる

2024/09/06に公開

本記事は、Lifehackerにより翻訳されたものです。
https://lifehacker.com/tech/you-can-try-googles-latest-ai-image-generator-right-now

グーグルの最新AI画像生成モデル「Imagen 3」が米国で一般公開されました。無料のグーグル・アカウントさえあれば試用可能です。VentureBeatが発見したように、同社はそのモデルをひっそりと公開し、8月20日にその研究を論文で発表しました。これは、同社が5月のGoogle I/Oで新モデルを初めて発表してから2ヶ月後のことである。

機械学習プラットフォームのHugging Faceへの投稿で、グーグルの研究者は「テキストプロンプトから高品質の画像を生成する潜在拡散モデル、Imagen 3を紹介します。我々の品質と責任の評価について述べます。Imagen 3は、評価時に他の最先端(SOTA)モデルよりも優先されます。さらに、安全性と表現にまつわる問題や、我々のモデルの潜在的な害を最小化するために用いた方法についても述べます。」

私が最初に行ったアマチュアのテストでは、このモデルは非常に信頼できるようです。フォトリアリスティックな画像を要求した場合、結果は比較的高品質で、一見した人を欺くようなリアリズムもあります。(特に、35mmフィルム風の画像を作成させたときのクオリティには感心しました)。Imagen 3は、出力に影響を与えたプロンプトの特定の部分をハイライト表示するので、画像の出方が気に入らない場合は、その部分を調整することもできます。

しかし、Imagen 3が提供する画像には、AIが生成した画像の特徴がまだ残っています。いくつかの写真では、手の指が多すぎたり、顔が歪んでいたり、文字が意味をなしていなかったりします。(「コカ・コーラ」と「キヤノン」のロゴは、商標権を侵害する正確さで再現できましたが)。

今週、新しい画像モデルをリリースしたテック企業はグーグルだけではありません。Xは最近、同社のAIチャットボットであるGrokの新しいベータ版をプッシュしました。ユーザー(特に米LifehackerのMichelle Ehrhardt)はGrokを使って、MAGAハットをかぶったテイラー・スウィフトからAK-47を持ったピカチュウまで、あらゆるものを生成しました。

一方、Imagen 3は明らかなガードレールを表示します。Googleの画像ジェネレーターに何か物議を醸すようなことを要求しようとすると、それ自体を停止し、なぜ私の要求が適切でなかったのかを理解するために、Imagen 3のFAQを丁寧に案内してくれます。また、著作権で保護されたコンテンツの生成も拒否されますが、適切なプロンプトがあれば、それを生成するようにだますことができます。上述したように、私はロゴを生成することができましたし、銃撃戦をさせることはできなくても、マリオやピカチュウのような商標登録されたキャラクターを吐き出させることさえできました。

Imagen 3のお試し方法

Googleの新しいAI画像ジェネレーターは、Googleアカウントを持っている米国のユーザーなら誰でも無料で試すことができます。GoogleのAIテストキッチンにあるImageFXにアクセスしてください。Googleアカウントでログインし、プロンプトが表示されます。

以上、Googleの最新AI画像生成モデルーー「Imagen 3」について紹介しました。ほかのAIツールに関心を持つ方に、写真をアップロードするだけで、AIが自動的に写真 イラスト化にするオンラインツールToongineer、低解像度の画像をピクセルレベルから補足し、高画質化してくれるVanceAIシリーズのAI画像高画質化を試すのをおすすめします。

Discussion