Open3ヶ月前にコメント追加8

ModalでComfyUIメモ

ピン留めされたアイテム

cd modal-comfyui-deploy
uv init
uv sync

uv run modal serve comfyapp.py

uv run modal shell comfyapp.py::ui

https://modal.com/blog/scaling-comfyui

Volume

https://modal.com/docs/guide/volumes

https://modal.com/pricing

保管料はかかりますか?
現在、ネイティブの高パフォーマンスファイルサービングオブジェクトであるボリュームは無料です。これは2026年初頭に変更される予定です。ボリュームの有料化が開始された際には、Amazon S3の料金と同程度になる予定です。

Auth

SageAttention

https://github.com/thu-ml/SageAttention

https://note.com/4m74/n/n0cbcd4a1029a

Modalでもbuild時のgpuチェック回避すればよさそう

# comfyapp.py
.run_commands(
        # CUDA 12.8（nvcc）導入
        "set -eux; "
        "wget https://developer.download.nvidia.com/compute/cuda/repos/debian12/x86_64/cuda-keyring_1.1-1_all.deb; "
        "dpkg -i cuda-keyring_1.1-1_all.deb; "
        "apt-get update; "
        "apt-get install -y cuda-toolkit-12-8; "
        # 1) clone（固定ディレクトリ）
        "rm -rf /opt/SageAttention; "
        "git clone --depth=1 https://github.com/thu-ml/SageAttention.git /opt/SageAttention; "
        # 2) setup.py の GPU検出ブロックを削除
        #   - リポジトリ直下に setup.py があるので “/opt/SageAttention/setup.py” を編集
        #   - パターンの違いに備え、2通りのレンジ削除を試し、いずれかが当たればOK
        "sed -i '/if not compute_capabilities:/,/Detect GPUs with compute capabilities/d' /opt/SageAttention/setup.py || true; "
        "sed -i '/# BEGIN GPU DETECTION/,/# END GPU DETECTION/d' /opt/SageAttention/setup.py || true; "
        # 3) ビルド：環境変数は同一シェルで export → pip install
        'export CUDA_HOME="/usr/local/cuda-12.8"; '
        'export PATH="$CUDA_HOME/bin:$PATH"; '
        # 4) 複数SMをサポート（T4=7.5, A100=8.0, RTX30=8.6, L4/4090=8.9, H100=9.0）
        'export TORCH_CUDA_ARCH_LIST="7.5;8.0;8.9;9.0"; '
        'export CMAKE_CUDA_ARCHITECTURES="75;80;89;90"; '
        "export FORCE_CUDA=1; "
        "cd /opt/SageAttention; "
        "pip install -v --no-build-isolation ."
    )

sageattention2系とxformersを入れたら--use-sage-attention で起動してもQwen Image Editで無事動くようになった。

Wanではまだerrorが出てフォールバックされてしまっているのでうまくbuildができていないのかも

Requested to load WAN22_Animate
loaded partially 32223.01729244847 32223.017250061035 316
  0%|          | 0/6 [00:00<?, ?it/s]Error running sage attention: SM80 kernel is not available. make sure you GPUs with compute capability 8.0 or higher., using pytorch attention instead.
Error running sage attention: SM80 kernel is not available. make sure you GPUs with compute capability 8.0 or higher., using pytorch attention instead.