画像生成系AIについてのまとめ

画像生成系AIについてまとめ
StableDiffusion webUIを使う前提で色々まとめる。
デザイナーやAI分野に詳しくない人向けとしてもわかる感じにできれば。
StableDiffusion webUI
まだ途中なので随時更新予定。
インストールについて
ちょい面倒なので別記事にする予定。
起動方法
webui-user.batで起動する。
webui-userは内部的にはwebui.batをオプション付で起動するもの。
起動オプション指定について
指定方法
webui-user.batを開いて、
set COMMANDLINE_ARGS=--arg1 --arg2
のように追記する。
xformers
これを設定しておくと、画像生成速度UPとVRAMの使用量を大幅削減される。
ただ、同じseed値を使っても差分が少し生まれるようになるので注意。
set COMMANDLINE_ARGS=--xformers
モデルについて
選定
基本は自分が描いてほしいモノにあった絵柄のものを選ぶ。
※モデルの使用条件は投稿者によって違うので要注意。よく読みましょう。
- 主なモデル取得先
- Hugging Face
-
CivitAI
- checkpoint:モデル
- LORA:LoRA学習ファイル
用語
fp16:半精度版
fp32:単精度版
ckpt:チェックポイントの拡張子
safetensors:安定版の拡張子
pruned:軽量版
無印:フルサイズ
基本は
pruned
safetensors
の選択でよさそう
モデルを置く場所
StableDiffusionをインストールしている中に置くことになる。
- 置く場所
インストールしたフォルダ/stable-diffusion-webui/models/Stable-diffusion
置いたら再起動。
VAEについて
VAE(Variational Autoencoder、変分自己符号化器)は画像生成系AIにおいて
簡単にクオリティを上げてくれるもの、というくらいの認識でOK。
モデルだけだと結構もやもやするけど、VAEを設定するとかなりはっきりとする。
- 特定モデル専用のVAE
- 汎用のVAE
の2種あるので、VAEを使う際はモデルに合わせてやるか汎用でやるかになる。
- 置く場所
インストールしたフォルダ/stable-diffusion-webui/models/VAE
置いたら再起動。
webui上から
Settingsタブ→SD VAEという項目のプルダウンより選択し、Apply Settingsボタンで反映。
プロンプトについて
基本的に最初に書いている方が強く影響する。
品質・作風・環境・主体といった風に分類しつつ並び変えるのがベター。
品質だけは最初にもってきている方が良い。
強調の仕方
カッコを使うと強調される。
(要素)
とすると1.1倍になる。
((要素))
とすると1.21倍、(((要素)))
とすると1.33倍に。
一緒に上げたい要素を複数入れるのもOK。
また、数字で指定することも可能。
レンジとしては1.6くらいが上限値。
(要素:1.5)
とすると1.5倍になる。
(要素,要素:1.5)
だと複数の要素に1.5倍となる。
逆に弱めるにはボックスカッコを使うと弱められる。
[要素]
とすると0.91倍、[[要素]]
とすると0.83倍になる。
ネガティブプロンプトについて
「反映してほしくない要素」を記述する。
プロンプトに書いていても、反対の意味を持つものを書くとより反映されやすい。
例えば、qualityを上げたい場合には
プロンプト:best quality, masterpiece
ネガティブプロンプト:worst quality, low quality
などを定義しておくと良い。
結構デフォルトで入力するものが決まってくるので、
纏めて反映してくれるようなネガティブエンベッドと呼ばれるものを導入するのがおススメ。
有名なものだと
- EasyNegative
- DeepNegative
などがある。
出力関係の設定について
各生成ページの下部の設定に関しての説明。
サンプリングについて
サンプリングメソッドについて
Euler aやLMS、DPMなど色々とあるが、
- 処理が遅い/早い
- 優しめの絵になりやすい
- 濃いめの絵になりやすい
- サンプリング数によって絵が結構かわる
それぞれに特徴がある。
XXXX a
と最後にa(Ancestral)がついているものはステップ数を上げると絵が変わる。
Karras
とついたものはノイズが減ってシャープになる。
参考:サンプラーの違い・全サンプラーの比較【Stable Diffusion web UI(AUTOMATIC1111版) / Sampler】
サンプリングステップについて
多ければ多いほど詳細に描かれるようになる。
ただし、やりすぎると違和感強くなるので、大体は20~40くらいがおススメ。
サンプリング系のオプションについて
- Restore faces(顔の修正)
顔の修正。アニメ系だとあんまりいいようにならないので外す方が良い。 - Tiling
人物では不要。 - Hires.fix
高画質にする。基本2倍ずつ程度が良さそう。設定が上級者向け。顔の崩れなどを対応するのに使ったりする。後述。 - Width Height
出力する幅・高さ。基本は以下のような形でやるのが良い。大体512,768,960くらいで調整したいところ。- 正方形:512×512
- 縦長:512×768
その他
- Batch count:生成を何回行うか
- Batch size:何枚の画像を生成するか
- CFG Scale:どれだけ呪文に忠実か
LoRAについて
LoRAとは追加学習方法の一つ。
参考:LoRAを使って遊んでみよう!学習ファイルのインストール方法と使用方法解説!【Stable Diffusion】
【AIグラビア、LoRA、LoCon】スマホでも出来る!!LORAで好きな絵師の画風を完全コピーする方法、完全解説、ポケカのさいとうなおき先生編【AI絵師、Stable Diffusion】
その他色々
顔の描画をよくする方法
顔がきれいにできないんだけど?【Stable Diffusion web UI Hires. fix】
結構拡大に使用するUpscalerのアルゴリズムで変わってしまうので注意。