👋

【LoRA学習ログ】kohya_ss + dataset-tag-editor-standalone による学習ワークフロー

に公開

はじめに

今回は Windows 環境で、Stable Diffusion 用の LoRA(Low-Rank Adaptation)を作成するために、以下の構成で学習環境を整えました。

  • モデル学習ツール:kohya_ss(GUI)
  • タグ編集ツール:dataset-tag-editor-standalone(Gradio)
  • GPU:RTX 4070 Ti SUPER
  • CUDA:12.4 + torch 2.5.0
  • Mixed Precision:fp16

マシンの詳細やスペックはこちらを参照

環境構築手順

1. 開発環境

現在のLoRA開発環境(C:\AItools以下)のディレクトリ構造をツリー形式で表現すると以下のようになります:

C:\AItools
├── dataset-tag-editor-standalone
└── lora
    ├── kohya_ss                  ← kohya_ss 本体+GUI
    ├── model                     ← 学習に使用するモデル(例:Anylora)
    ├── output                    ← LoRA学習出力(*.safetensors, log, .toml)
    └── train
        └── aichi
            └── 10_test          ← 繰り返し数 10 の学習用画像とキャプション

この構成において:

  • kohya_ss:LoRA学習スクリプトとGUI(gui.bat)を含む主要ディレクトリ
  • model:学習のベースとなるチェックポイントファイル(例:anyloraCheckpoint_bakedvaeBlessedFp16.safetensors)を配置
  • train\aichi\10_test:画像と.txtキャプションを格納したLoRA学習用フォルダ(10はrepeats値を示す)
  • output:LoRA結果ファイル(例:aichi_v01.safetensors)や設定JSON/TOMLファイルが自動保存される場所

2. CPUアクセラレータの設定

> accelerate config

In which compute environment are you running?
> This machine

Which type of machine are you using?
> No distributed training

Do you want to run your training on CPU only (even if a GPU is available)? 
> NO


2. 仮想環境の作成(共通)

cd C:\AItools\xxx
python -m venv venv
.\venv\Scripts\Activate.ps1
python -m pip install --upgrade pip

3. dataset-tag-editor-standalone の起動

@echo off
cd /d C:\AItools\dataset-tag-editor-standalone
call venv\Scripts\activate.bat
python scripts/launch.py
pause

📸

4. kohya_ss のGUI起動

@echo off
cd /d C:\AItools\lora\kohya_ss
call venv\Scripts\activate.bat
gui.bat

📸


LoRA学習設定

設定項目 内容
Baseモデル anyloraCheckpoint_bakedvaeBlessedFp16.safetensors
解像度 512 x 512
Repeats 10
画像数 10枚(合計 100 step)
バッチサイズ 1
Precision fp16
Bucket 有効(no upscale)

出力ファイル:

C:\AItools\lora\output\test_v01.safetensors

📸


Stable Diffusion WebUI にLoRAを適用

  1. 出力された .safetensors を以下へコピー:
C:\Users\harieshokunin\stable-diffusion-webui\models\Lora\test_v01.safetensors
  1. WebUIを以下の引数で起動:
webui-user.bat --xformers --api
  1. baseモデルはSD1.5系(例:AOM3)を使用

📸

loraタブからがloraが表示されてることを確認


トラブルと解決策まとめ

問題 原因 解決策
accelerator device: cpu のまま accelerate config 未設定 accelerate config で GPU 指定・fp16選択
xformersエラー bf16指定 & CPU落ち precisionを fp16 に変更
WebUIでLoRA未認識 SDXL系モデル使用 SD1.5系に切り替え

まとめ

  • accelerate config を正しく通すことで GPU を認識し高速化に成功
  • SDXL用LoRAは別手法が必要なため、SD1.5向けに学習した
  • dataset-tag-editor + kohya_ss GUI の併用は画像とタグの管理に便利

参考リンク

Discussion