Open1
Stable Diffusion でやりたい
メモ
- リアルな写真の画像生成、結構な頻度で奇形になるのなんとかならないかなぁ
- 同じプロンプトでもモデル毎に結構印象のちがう画像が出力されるので、モデル毎のプロンプト調整が必要なんだなぁ
- 普通の高画質化は Hires. Fix ではなく Extras タブからやるのでよかった
- GPT-4 に考えさせたプロンプトを StableDiffusion WebUI のスクリプトに入力するの、いいかも
- Inpaint anything、高速で動くならめっちゃ便利だなぁ
- リアルタイムで CFG Scale とかをノブで回しつつ VJ できるとおもしろそうだな
- 高画質化してから服の色を変えたりしたほうがいのか、服の色を変えてから高画質化したほうがいいのかa
- Inpaint などで服の色を変えてから高画質化すると大きく画像の内容が変わりそうなので、まず高画質化したほうがよさそうな気はする
- なのでやっぱり高画質化したあとにも素早く試行錯誤できるように速い GPU ほしいなぁ
- 基本的なできるようになりたいこと
- 人物の表情を変える
- 人物のポーズを変える
- 人物の顔を変える
- 人物の体型を変える
- 人物の服装を変える
- 人物の服装を簡素化・無地化する
- 一度生成した画像の解像度をあげる
TODO
-
Seed が近いほど同じ顔になるらしいので、face focus とかで顔より画像作って、Seed を 1 ずつインクリメントしていったのを動画にしたい
-
架空のヘッドホン、架空のギターなども生成したい
-
毎晩なんか時間かけて画像・動画生成したい
-
StableDiffusion WebUI で指定できるパラメーター、一通り理解したい
-
Control Net の機能をもっといろいろ試したい
-
デビッド・リンチっぽい画像を生成したい
-
ねぷた絵 / 呑龍さんの絵を学習させてねぷた絵を自動生成してみたい
-
Gradys Knight and The Pips みたいな画像を生成したい
-
猫たち美少女化、もっとやりたい
-
うちの猫たちが外を歩いてる写真を生成したい
-
架空のスニーカーのデザイン生成させたい (Nike AF-1 などをベースに)
-
モノトーンの漫画生成できないのか
-
好きな画像できたら LoRA にするといいのかな? (同じキャラを生成するために LoRA 作る的な)
-
【Stable Diffusion】同じ顔にできるReference Onlyの使い方について解説 | AIイラスト攻略
- Reference only の場合、高解像度化はできないとか
-
LoRA を作るとき、キャプション的なやつをアレしたほうがよい?
-
自分が描いた絵を学習させてみる
-
猫の写真を学習させるとき、猫だけ切り抜いて部屋の背景は含めないほうがいい?
-
testmemo-v0.0.0.safetensors、ファイル名変えたのに stable-diffusion-webui から使うと名前が test2-v0.0.0 となってしまう気する
PENDING
- Checkpoint の追加学習モデルとして LoRA を作るということは、Checkpoint 本体を使わないとそこから派生した LoRA は利用できない?
- 適当にダウンロードした LoRA は利用できてるようにも見えるが…
- 同じ Seed だと同じ顔になるというのは、Prompt を引き算しても変わらないのか? 足し算したほうが変わらない?
- そうだとすると、なるべくシンプルな Prompt + Seed で目的の顔を作り出したほうがよい?
DONE
- 1 枚ずつでなくバッチ処理で Hires. fix かけたい
- いったんやらない
- VAE とは?
-
【比較検証】Stable Diffusionの『VAE』とは?使い方やおすすめVAEも紹介 | Romptn Magazine
- なんか画質を特定の方向によくしてくれるやつみたいだが、いったんは使わなくていいかなぁ
-
【比較検証】Stable Diffusionの『VAE』とは?使い方やおすすめVAEも紹介 | Romptn Magazine
- xformers ってなに? 使ったほうがいい?
- 下記みると Mac では動かないようだ
- LCM LoRA で画像生成を高速化してみたい
- なんかうまくいかないのでいったんあきらめる
- StableDiffusion WebUI の Script、理解したい
- Prompts from file or textbox
- Iterate seed every line: ランダムに Seed を生成し、それを 1 行ごとにインクリメント
- Use same random seed for all lines: ランダムに Seed を生成し、それを全行に適用
- どちらにもチェックをつけないとすべての行で毎回ちがうランダムな Seed が適用される
- どちらにもチェックをつけると Iterate 〜 の挙動が勝つ
- スクリプトを有効にすると Batch count / Batch size は効かなくなるっぽい
- Prompts from file or textbox
- Inpaint anything 試す
-
Error loading script: inpaint_anything · Issue #56 · Uminosachi/sd-webui-inpaint-anything
- 上記起きたので書いてあるように venv 消して再起動したら解決した
- セグメント作るのめっちゃ時間かかるっぽい
-
Error loading script: inpaint_anything · Issue #56 · Uminosachi/sd-webui-inpaint-anything
- Stable Diffusion と SDXL の関係は?
-
Stable Diffusionの新モデル『SDXL』の使い方!導入方法も紹介 | Romptn Magazine
- SDXL は新しい Checkpoint (?) みたいなもので stable-diffusion-webui で利用できるらしい
- 実際に上記手順で導入してみた、1024x1024 で生成するので普通に遅い…
-
ASCII.jp:世界を変えた画像生成AI、さらに進化「Stable Diffusion XL(SDXL)」いよいよ正式公開 (1/4)
- 短いプロンプトでそれっぽい画像が出るようになった、性的な画像が出づらくなった
-
Stable Diffusionの新モデル『SDXL』の使い方!導入方法も紹介 | Romptn Magazine
- ねこ動画を mov2mov したい
- 顔がおかしく描画されたときに修正する方法は?
- ADetailer でとりあえず直せた
-
Stable Diffusionの『Refiner』とは?使い方や設定方法について解説! | Romptn Magazine
- 画像生成時にほかのモデルを少し混ぜたりできるやつっぽい
- Checkpoint / Model のマージってなに?
- 複数の Checkpoint をマージできるやつっぽいな: Stable DiffusionのCheckpoint Mergerの使い方について解説
-
【高解像度化・高画質化】最高にかわいくアップスケールする方法【Hires.fix|ControlNet Tile】|これすご-AIクリエイティブ-
- とりあえずデフォで入ってた Hires. fix 試した、微妙に印象変わってしまうようだな…
- Denoising strength 0.5 だと普通の画質で、0.4 では解像度低い画像になった
-
SenY/LoRA · Hugging Face
- breathing fire という LoRA がおもしろいので試してみたい → いったんチョロっと試した
- サイコロ & リサイクルボタン右の
Extraの使い方は?- このページに書いてた: Stable DiffusionのSeed(シード)値とは?調べる方法やおすすめも紹介 | Romptn Magazine
この結果から、元画像より少しだけ変化を付けたい場合は、『Variation strength』を0.2以下にしましょう!
- このページに書いてた: Stable DiffusionのSeed(シード)値とは?調べる方法やおすすめも紹介 | Romptn Magazine
- Seed の数値が近いと似た顔になるのか?
-
Stable DiffusionのSeed(シード)値とは?調べる方法やおすすめも紹介 | Romptn Magazine
Seed(シード)値が「1」ずつ変わるごとに新しい画像が作られ、Seed(シード)値は近ければ近いほど似たような画像が生成されるという特徴があります。モデルを変更しても、ポーズや背景など画像全体の特徴はおおよそ引き継げるので、ぜひ試してみてください!
-
Stable DiffusionのSeed(シード)値とは?調べる方法やおすすめも紹介 | Romptn Magazine
- Batch count 100 で画像生成すると同じ Prompt・同じ Seed でちがう画像が 100 個生成されるが、同じ Prompt・同じ Seed なのになぜちがう画像になるのか?
- よく見たら Seed が 1 ずつインクリメントされてた
- Hugging Face にモデルをアップしてみる
- 下記らへんを参考にやってみた
- 払い出したトークンで huggingface-cli login したあとは普通に git clone して add / commit / push みたいな感じだった
- アップロードした先はここ: tily/lora · Hugging Face
- Batch size はどういう意味?
- Batch count (1〜100) が順番に生成する画像数で、Batch size (1〜8) が同時に生成する画像数、つまり 1 回のクリックで最大 800 画像を生成できる
- VRAM に余裕があれば Batch size を大きくしたほうが画像生成にかかる時間が短いらしい
- CLIP Interrogator 試してみる
- [pharmapsychotic/clip-interrogator-ext(https://github.com/pharmapsychotic/clip-interrogator-ext) を導入して試した
-
Stable Diffusionでmov2movを使ってAIダンス動画を作成する方法
- 試してみたけどめっちゃ動画生成にめっちゃ時間かかったので、もう少し時間かからないようにパラメーターなど調整してみたいかも (?)