📖

【AIグラビア】プロンプトの知識が0でもChatGPTを使ってStable Diffusionで思い通りの画像を作成してもらう方法

2023/05/11に公開

Stable Diffusion

ChatGPT

tech

最近、AIグラビアが話題になっていますよね。

理想の美女を自分の好きなシチュエーションで、思いのままに画像を作り出すなんて、まさに男の夢ですよね！！！！

でも、その夢を現実にするために、色々と調査してやってみたけれど、いざ実際にやってみると、思った以上に理想の画像を作るのが難しく、途中で挫折してしまった方も多いと思います！

生成する結果は呪文（プロンプト）次第で大きく変わるので、技術的な知識がないと最初はなかなか難しいです。

なので、自分の理想通りの画像を作れるようになるためには、いろいろと試したり、他の人のプロンプトから学んでいく必要があります。

ですが、正直、そんな面倒なことはせずに、素早く自分の理想の画像を作りたいですよね。

そこで、今回はプロンプトを学ばなくてもChatGPTを使って、自分の欲望に基づいた理想の画像を作る方法を紹介します！

この方法はStable Diffusionのプロフェッショナルから見ると少し非効率かもしれませんが、難しいことは考えずに、さっと理想の~~エロい~~画像を作りたいという方にはおすすめです。

Stable Diffusionのはじめ方

今回は、Stable Diffusionの環境設定は完了して色々と試したけど、自分の思い通りの画像が作れなかった人向けの内容なので、初期設定方法は割愛させてください

私は、以下の記事や動画を参考にして、Google colab proで始めました
モデルはBRA V5を使っています

ChatGPTを使ってStable Diffusionで思い通りの画像を作成してもらうための手順

ChatGPTのモデルは今回はGPT-4を使っています。

Stable Diffusionの設定は以下の通りです。
スクリーンショット 2023-05-08 9.42.11.png

Sampling methodは「 DPM++ 2M Karras」で、Restore facesにチェックを入れて、それ以外は初期設定のままです。

Restore facesにチェックを入れると、崩れがちな顔が自動で補正されます。

①：ChatGPTにStable Diffusionが何かを覚えてもらう

2023年5月現在は、ChatGPTは「Stable Diffusion」を認識していないので、まずは「Stable Diffusion」の概要について学習させます。

私は以下の記事から「Stable Diffusionとは？」の文章をコピペして、この内容から「Stable Diffusion」が何かを推測させることでChatGPTに学習させます

FireShot Capture 008 - _Understanding Stable Diffusion AI_ - chat.openai.com.png

プロンプトとネガティブプロンプトの違いは覚えておいて欲しかったので、追加で教えています
FireShot Capture 008 - _Understanding Stable Diffusion AI_ - chat.openai.comのコピー.png

②：理想の画像のプロンプトの初稿を作ってもらう

ChatGPTに「Stable Diffusion」が何かを覚えてもらったので、次に作って欲しい画像を伝えて、プロンプトの初稿を作ってもらいましょう

今回は以下のように伝えてみました

21歳の黒髪ロングの女性がベッドルームでメイド服を着ている画像を作りたいから、プロンプトとネガティブプロンプトを考えて

スクリーンショット 2023-05-11 9.47.10.png

それっぽい返事が返ってきたので、まずはこれを使って最初の画像を作ります。

この際にChatGPTが作ってくれたプロンプトに加えて、画像のクオリティを上げてくれる汎用的なプロンプトとネガティブプロンプトも入れておくと、自分の理想に近づくのが早いです。

とりあえず、今回は以下の記事を参考に追加しておきました。

https://www.ai.iwachoco.com/?p=17

追加したプロンプト
masterpiece,best quality

追加したネガティブプロンプト
lowres, ((bad anatomy)), ((bad hands)), text, missing finger, extra digits, fewer digits, blurry, ((mutated hands and fingers)), (poorly drawn face), ((mutation)), ((deformed face)), (ugly), ((bad proportions)), ((extra limbs)), extra face, (double head), (extra head), ((extra feet)), cropped, worst quality, monster, logo, humpbacked, long body, long neck, jpeg, ((jpeg artifacts)), deleted, old, oldest, ((censored)), ((bad aesthetic))

よくわからない人は同じものを追加すればOKです

③：どこが理想と違うかを伝えて修正案をもらう

ChatGPTに作ってもらったプロンプト+汎用的なプロンプト、ネガティブプロンプトが以下になります。まずはこちらで画像を作ります。

プロンプト
masterpiece,best quality,A 21-year-old woman with long black hair in a maid's dress in a bedroom

ネガティブプロンプト
lowres, ((bad anatomy)), ((bad hands)), text, missing finger, extra digits, fewer digits, blurry, ((mutated hands and fingers)), (poorly drawn face), ((mutation)), ((deformed face)), (ugly), ((bad proportions)), ((extra limbs)), extra face, (double head), (extra head), ((extra feet)), cropped, worst quality, monster, logo, humpbacked, long body, long neck, jpeg, ((jpeg artifacts)), deleted, old, oldest, ((censored)), ((bad aesthetic))

こちらが最初に出来上がった画像です。

こちらの指定したシチュエーションに合致しているとはいえ、まだ理想とは遠いですね

それでは、理想の画像を近づけるために ChatGPTにプロンプトを修正してもらいましょう。

その際に、私は以下のテンプレでプロンプトの修正をお願いしています。

今回は愛嬌とスタイルの良さが欲しかったので、それを追加するようにお願いしています。

## 現在のプロンプト
masterpiece,best quality,A 21-year-old woman with long black hair in a maid's dress in a bedroom

## 現在のネガティブプロンプト
lowres, ((bad anatomy)), ((bad hands)), text, missing finger, extra digits, fewer digits, blurry, ((mutated hands and fingers)), (poorly drawn face), ((mutation)), ((deformed face)), (ugly), ((bad proportions)), ((extra limbs)), extra face, (double head), (extra head), ((extra feet)), cropped, worst quality, monster, logo, humpbacked, long body, long neck, jpeg, ((jpeg artifacts)), deleted, old, oldest, ((censored)), ((bad aesthetic))

## 現状
もっと笑顔で愛嬌があって、さらにスタイルが良くなって欲しいがなっていない

## 命令
①もっと笑顔で愛嬌があって、さらにスタイルが良くなって欲しいがなっていない理由を5つ考えてください.（考えるだけで表示する必要はありません）
②その理由を考慮して「現在のプロンプト」と「現在のネガティブプロンプト」を修正してください。プロンプトは単語で区切ってください

ここで重要なのが、なぜ理想の画像と違ったのかをChatGPTに最初に考えさせることです。

自分で原因を考えさせてから、プロンプトを作らせた方がより理想に近づきます

実際にお願いしたところ、プロンプトを修正してくれました。

次はこちらで画像を作ってもらいます。

④理想の画像が出来上がるまで③を繰り返す

次にできたのがこちらです。

前回に生成してもらった画像と比べると、しっかりと笑っていてスタイルも良くなっていますね！

ただ、もう少し顔立ちを整えたいので、その要望をChatGPTに伝えます…というのを繰り返して理想の画像に少しずつ近づけていくのが今回のやり方です！

今回はもう少しだけ続けてみます。

以下のように伝えました。
スクリーンショット 2023-05-11 12.22.56.png

再度、画像を作ってみます

良い感じですね！！

最後に、背景がビジネスホテルのベッドルームみたいなので、高級ホテルのベッドルームに変えてもらいます。

スクリーンショット 2023-05-11 11.44.06.png
良さげな画像ができたので、今回はここまでにします！
00016-3424166319 (1).png
ご覧の通り、何も考えずに要望だけをChatGPTに伝えるだけで、自分の理想の画像が出来上がりました。

もちろん、複雑な設定とか細部にこだわるとChatGPTとのやり取りは増えますが、少しずつ自分の理想の画像に近づいていくはずです！

まとめ

今回はChatGPTを使って、プロンプトの知識が0でもStable Diffusionで思い通りの画像を作成してもらう方法を紹介しました！

最初で作った画像と最後に作ってもらった画像を比較すると、かなり~~エロい~~理想の画像になっていますね！
スクリーンショット 2023-05-11 12.42.56.png
こちらの方法を使えば、プロンプトの知識が0でも誰でもStable Diffusionで思い通りの画像が作れるようになるので、ぜひ試してみてください！