stable diffusion web uiをmacで + civitai の Loraを使う

とりあえずM3 Pro Macなのでlocalでsd web uiを動かしてみよう
参考に。

2系だと制約がありそう。もとの記事でも2を入れると動かないとあった。
とりあえず2系を入れて動かなかったら1.5にするか
2なら動く、をみたのでこっちを頼るか

とりあえずDLはおわった。

cd stable-diffusion-webui
mv ~/Downloads/sd-v1-4.ckpt ./models/Stable-diffusion
とりあえず準備はできたので stable-diffusion-webui
のトップレベルで
./webui.sh
ツールインストールに時間がかかるので待つ。

結果はどうであれ実行はできていそうである

civitai
stable diffusion web ui自体は動いた。Loraをcivitaiから拾ってきたいのでそちらを進める。

loraモデル選びの文言集
loraモデルは一旦なんでも良いのでこれで。
DLする。

DLしたloraをweb uiにセットする
mv ~/Downloads/dataviz_style_xl_v1.safetensors ./models/Lora
Loraタブを開く。お、出てきた

LoraをWeb uiでクリックするとトリガーワードが出てくる。
同じプロンプトでやってみる
Loraが動いてる感じはないが、実行はできた。

civitaiは画像とともにプロンプトを公開してくれている。
たとえばこれだと
dataviz style, black and white network data visualization in the shape of a cyberpunk girl, masterpiece , hyper detailed, unreal engine, blue tones, stars lora:dataviz_style_xl_v1:1
ってプロンプトらしい。meta dataの調整はおいておいて実行してみる
なるほどぜんぜん違うw

meta dataたち
一旦、negative promt とかすぐにできるところから再現してみる。
ぜんぜん違うなぁ。ちなみにサンプラーってやつを変えると品質が変わるらしい。

サンプラーを変更しても対して変更がない。

もう一回civitaiのgeneration dataをみる
checkpointとはなんだろうか?
Stable Diffusionに導入できる学習ファイルには、LoRAと呼ばれるモデルも存在します。CheckpointとLoRAの違いを一言で表すと、生成画像に与える影響度が異なります。
だそう。元画像はcheckpointが入っているので生成結果が変わるのかな。
を試してみる。6.5GBと大きいがきっとcheckpointで刺しているmodelで女性のモデルの描き方を大筋指定しているのだろう
同じくDLしたものをLora ディレクトリに。
mv ~/Downloads/dreamshaperXL_v21TurboDPMSDE.safetensors ./models/Lora
SD web uiのサーバを起動し直すと
Loraには出てくるが、checkpointに出てこないな

mv ./models/Lora/dreamshaperXL_v21TurboDPMSDE.safetensors ./models/Stable-diffusion
と /models/Stable-diffusion
に移動したらcheckpointタブに出てきた。

かなり近しい画像が生成された
自分が生成したやつ
参考にしている画像
設定としては以下をやった。

元画像のサイズが1050x1400と大きめなので同じ数字にして実行する
実行時間については、やはり解像度を上げるとかなり伸びる傾向にあるっぽい。512x512は20秒ほどでかってくるが1050x1400は2-3分かかる。
生成された画像はこちら。だいぶいい感じになった。
一旦やりたいことは分かった👏

いろいろ試してみたけど
- checkpointが大本の方向性を決めるモデル ( /models/Stable-diffusion )
- Loraが微修正を行うモデル (/models/Lora)
という印象で考えると良さそう。
この場合は DreamShaperが登場するものの大筋の描き方を決めて、Data Visual...がその後の描き方を決める、みたいな感じなんだと思う。多分、人間で言えば整形と化粧くらい違う。