【ComfyUI/Qwen/エレベーターフォト】RTX3060をつかってローカル画像生成でNANO BANANA風の置き換えをたのしむ
課題
NANO BANANAで流行中の画像編集(着せ替え・置き換え)を、有料APIではなくローカル画像生成でおこなう。
解決策
- 「Qwen Image Edit 2509」をインストールして、「ComfyUI (Desktop)」で生成
環境
systeminfo
OS 名: Microsoft Windows 11 Pro
物理メモリの合計: 16,094 MB
利用できる物理メモリ: 281 MB
仮想メモリ: 最大サイズ: 69,129 MB
仮想メモリ: 利用可能: 10,250 MB
仮想メモリ: 使用中: 58,879 MB
Get-CimInstance Win32_Processor | Select-Object Name
Intel(R) Core(TM) i5-14500
参考記事
たねやつの木『ComfyUIで「Qwen-Image-Edit-2509」を試す!RTX3060でも余裕で動く nano-banana相当のオープンモデル』
詳細
「Qwen Image Edit 2509」は、アリババクラウドが公開している画像編集向けの生成AIモデルです。Qwen(キューエン)という名称は、もともと「通义千问(トンイー・チエンウェン), Tongyi Qianwen」という、なんでも答える、というコンセプトのベータ版から来ています。
「ComfyUI」というのは、画像生成をするためのインターフェースのひとつで、とくにノードを手順的につなげていくプログラマブルなかたちが特徴です。最初はかなりとっつきにくいですが、慣れてくると非常に便利かつ効率的で、かゆいところに手が届くため、デファクトスタンダード化しています。
今回は扱いやすいように「ComfyUI Desktop」というデスクトップアプリで行います。
インストールできたら、左サイドの「Templates」から「ワークフロー」を利用させてもらいます。モデルの特性や、やりたいことによって、構築すべき手順が異なるため、さまざなな手順書(ワークフロー)が用意されています。
今回使う「Qwen Image Edit 2509」というモデルも、すぐにネイティブ対応されたので、使えるようになっています。ComfyUIのバージョン0.3.60です。
「Templates」をクリックするとモーダルが出るので、左サイドの「画像」から「Qwen Image Edit 2509」を探して、右端の矢印アイコンをクリックすると、構築済みのワークフローが出現します。

いろいろインストールするように注意書きが出るので、すべてインストールします。たぶん20GBぐらいかかると思います。
ワークフローの真ん中下ぐらいに、画像をアップロードするノードがあります。今回は、牛乳を注ぐ女と、以下の男性の画像をアップロードしました。
ノードが有効化されていないと使えないので「Ctrl + B」で有効化してください。

プロンプトは上のほうにあります。「絵画のなかの牛乳を注ぐ女性に、男性を完全に置き換えてください」というシンプルなプロンプトにしました。もっと細かく指示することで、クオリティは上がっていきます。
Replace the milk-pouring woman in this painting with this man completedly.

できた画像
ComfyUIをどこに蔵置したかによりますが、初期は「ドキュメント」に置くかと思います。C:\Users\user名\Documents\ComfyUI\output に画像が保存されています。

エラーになるとき
エラーメッセージ次第ですが、仮想メモリの容量が足りていない可能性があるので、Windows自体の「設定」→「システム」→「バージョン情報」→「[関連リンク]システムの詳細設定」→「パフォーマンス・設定」から仮想メモリを増やしてみてください。
Windowsを再起動して、ComfyUI Desktopをあらためて開くと使えるかと思います。
Discussion