ChatGPTの新機能DALL-E3を試してみた+プロンプトの作成例
はじめに
-
DALL-E3
(ダリスリー)はChatGPTの新機能であり、テキストから画像を生成する能力を提供します。 -
DALL-E
自体はOpenAIがChatGPTとは別に画像生成系のAIとして提供していましたが、最新版のDALL-E3
がChatGPTと連携できるようになったということです。 - この記事では、
DALL-E3
の基本的な活用例と、効果的に活用するためのプロンプトの指定方法や作成方法について解説します。
DALL-E3
を使用するためには
- ChatGPTの有料プラン
ChatGPT Plus
もしくはChatGPT Enterprise
でないと利用できません。 - 一部有料プランユーザに順次公開。
※投稿時点では全有料プランユーザに公開されています。
DALL-E3
はベータ機能の有効化などしなくても、新しいチャットを始める際に選択が可能となっています。
GPT-4
にカーソルを当てるとプルダウンで表示されます。
プルダウン上のDALL-E3
をクリックすることで、DALL-E3
を使用することができます。
他のベータ機能やプラグインにも言えますが、DALL-E3
を使えるのはチャット開始時にDALL-E3
を選んだチャットのみです。
すでに開始している他のチャットに追加して使用することはできません。
DALL-E3
の活用例
-
DALL-E3
はテキストから画像を生成することができます。たとえば、「夕日の中で飛ぶ鳥」のようなテキストを入力すると、そのテキストに対応する画像を生成します。 - 生成された画像は著作権的に問題ないもののようなので、安心して使えそうです。
- 著作権に引っかかりそうなキャラクタ名やセンシティブなワードについてはプロンプト入力時にChatGPTに生成を拒否されます。
某、東の方のプロジェクト的なものを指定した際の例。
コンテンツポリシー
プロンプトの指定方法
-
基本的なプロンプトの構造:
- プロンプトは基本的にテキスト形式で指定します。生成したい画像に関する説明を簡潔かつ明瞭に記述します。
- 記述した内容を元にChatGPTが
DALL-E3
を用いて画像を生成します。 - 特に指定が無ければ4つ画像を出力します。
- 制約として、
DALL-E3
のチャットでは画像を追加できません。通常のプロンプトでは可能。
何かの画像を元にDALL-E3
に画像を生成してもらうのは一工夫必要です。
口述するChatGPTによるプロンプト生成を活用するのがよいでしょう。
-
プロンプトの効果的な指定方法:
- 明確なビジュアルの指示を提供することで、望む画像をより正確に生成することが可能です。たとえば、"赤いバラの花束"や"青空の下で走る犬"など、色や動作を含む具体的な説明を提供します。
- ChatGPT版の
DALL-E3
最大の特徴は、一度作成された画像に追加で指示を出すことで画像の修正を行ってくれます。 - 最初は雑に指示をして出力された画像を見て、追加指示してイメージに近づけていくのが世効果的です。
実例
家族でサイゼに行った際にちょうどDALL-E3
が使えるようになった際に試したものです。
美味しそうな地ビール
リアル目なのもポップなタッチの絵も両方出てくるのがいいですね。
スマホでやってたのでその時はわからなかったのですが、出力された画像をクリックすると、その画像を生成したプロンプトが表示されます。
便利!
スマホでも画像タップ長押しでプロンプトをコピーできました。
続けて出力された画像からインスピレーションを受けて加工を指示してみます。
4に焼いたステーキ肉を加えて酒場の看板の絵に書き換えて
まな板の上にビールがおいてあるのが変なので、ビールはまないたから出した絵に書き換えて
仕事っぽく後で加工しやすいように文字部分を白抜きできないか聞いてみましたが、
指示の出し方が良くないからか、別なニュアンスの画像に置き換わってしまいました。
プロンプトの作成方法
プロンプトを作成する際には、具体的で詳細な表現を使用して、想像力を働かせます。
これにより、より独創的かつ精密な画像を生成することができます。
これは言うのは簡単ですがなかなかうまく出来ません。
プロンプト作成についてもChatGPTに任せるのが最適解だと思います。
プロンプト生成用チャットを作って生成してもらうのがよいでしょう。
プロンプトの例
あなたはAIを駆使して様々な課題を解決してきた凄腕プロンプトエンジニアです。
以下の{プロンプト作成ルール}にそって
DALI-Eで生成する画像のプロンプトを書いて。
生成する画像のコンセプトは後の会話で画像ファイルやテキストとして伝えます。
私が良いと考える具体的な例を{プロンプトの例}に示します。
理解したら「はい」と回答して。
{プロンプト作成ルール}
- 具体的で詳細な表現を使用して
- 想像力を働かせて
- より独創的かつ精密な画像を生成して
- 色、形、動作、環境などの視覚的要素を具体的に記述して
- 画像ファイルを入力した場合は、画像を再現できるようなプロンプトを書いて
- この会話ではプロンプトのみ出力し、計画は出力しなくてよい
{プロンプトの例}
## よいプロンプトが出来たら追加していく。
このプロンプトをDALL-E3
に生成してもらうチャットとは別に新しいチャットとして始めたチャットに張り付けて送ります。
そうするとChatGPT側がこちらの画像指示を待つ状態になるので、あとは画像のコンセプトを伝えたり、画像ファイルを添付することでそのプロンプトを生成してくれます。
このチャットに私のアイコンを見せてみた結果。
"鮮明な線で描かれた大きな魚が水中からジャンプし、水滴をバラまかせながら力強く舞い上がっている。その魚の鱗は詳細に描写されており、その目は鋭く前方を見据えている。魚のまわりには波や水のしぶきが華やかに広がり、それが魚の動きの速さとエネルギーを強調している。"
これをDALL-E3
に指示した結果
なんか思ってたの違いますが、これはこれでいいw
こんなこともできます。
やばい、カッコいい
作成例
-
ChatGPTがとりあえずで出してきた良いプロンプトの例
-
カッコいい侍。
以前、StableDiffusionに侍を書いてもらおうとしたらトンでもサムライが出力されてきたので、こんな雑な指示でこれが出てくるのはすごいと思います。
日本への理解が進んでいるのか!? -
プロンプトの生成元が何かは忘れましたが、宇宙で着物でかわいい女の子系的な
なんかのソシャゲのSRでいそう -
PC用の壁紙
ちゃんとPC用に横長にしてくれている。
ちなみに私の壁紙はWin11にして以来デフォルトのままです。
まとめ
- この記事では、ChatGPTの
DALL-E3
の活用例と、プロンプトの指定方法および作成方法について説明しました。 -
DALL-E3
を利用することで、画像を生成するハードルが劇的に下がります。
私が一日かけても今回紹介した画像1枚作れるかどうか怪しいです。
そのまま活用できる場所には有効に活用していけるでしょう。 - 一方で、細部へのこだわり具現化するには使い勝手はまだまだという印象です。
- デザインコンセプトと割り切って言葉だけでは伝わりきらないニュアンスを表現するという意味では使えそうだなという印象です。
- 良い画像を作るには良い表現が必要、自分の表現力のなさに愕然とします。
- プロンプトエンジニアはベースの語彙力や表現力が必要かもしれないです。
Discussion