Closed12

Vtuber簡単に作れるかな

ss

Obsidianに清書する前にこちらで雑記

ss

AI界隈には疎いけどそろそろささっとVtuber作れるんじゃねーのと思ったので試してみる。
実際に配信するわけじゃないけどできるだけ手抜きで楽してやれるか挑戦。
絵をかいたりしたことないのでできるだけ省エネでやりたい。

ss

必要そうなものはとりあえずこれくらいかな?

  • 立ち絵、原画
  • 動くモデル(2D or 3D)
  • 配信ソフト(配信はしないのでこれはいらん)
ss

ちょっと調べて可能性がありそうな省エネルートとしては3パターン

  1. 立ち絵を作って1枚の立ち絵を(talking-head-anime-3-demo)を使って動かす
  2. 立ち絵作ってlayerdividerでレイヤー分け、Live2Dでモデリング
  3. 金出して買う

まぁ3はあまり意味がないので1が一番楽そうだけどlive2Dも触ってみたいのでとりあえず1と2を並行で進めてみる。

ss

なんにせよ立ち絵用意するところから。
(何にも知らんけどまぁ生成AI使えば行けるやろと楽観視してたところ)

WebUI Forge

とりあえず生成AI(WebUI Forge)が背景透過して作れるようなので試してみる(タダだったし)

にじじゃーにー

日本語のプロンプト対応してるし月10ドルだったのでお試ししてみる
結構いい感じかな?1枚目エルデンリングのラニっぽくてお気に入りかわいい。
|50
|50

ss

Web Forge

とりあえずgit clone

git clone https://github.com/pkhungurn/talking-head-anime-3-demo

書いている通りに環境構築していく(Anaconda入れたりライブラリ落としたり)
Python環境構築してなかったのでPythonをWindowsStoreからインストール
(この後ごちゃごちゃやったけどPythonは3.10系じゃないとだめだった。
3.12とかだとバージョンが合わなかった)

poetryをPoetryからインストールする

環境変数に両方パスを通す

とりあえずアプリが起動するところまではたどり着いたけどiOSが必要なので一旦保留
(iPhoneXRが安く手に入りそうだったので注文。届き次第続きへ)

ss

layerdivider

ということでレイヤー分けの方を試す。
https://github.com/mattyamonaca/layerdivider/

こっちはツール動かすまでがちょっと色々手間だった
google colabの方は画面起動すると504で落ちるのでローカルで試すことに

まずはツールを落としてくる

git clone https://github.com/mattyamonaca/layerdivider.git

手順通りに環境構築してシェルを動かしてみるとエラーに

CUDA_PATH is set but CUDA wasn't able to be loaded. Please install the correct version of CUDA and cuDNN as mentioned in the GPU requirements page (https://onnxruntime.ai/docs/reference/execution-providers/CUDA-ExecutionProvider.html#requirements), make sure they're in the PATH, and that your GPU is supported.

CUDAとcuDNNのかみ合わせが悪いようなので対応表を確認して組み合わせを試してみると
CUDA 12.2と cuDNN v8.9.7でOKだった。
https://onnxruntime.ai/docs/execution-providers/CUDA-ExecutionProvider.html

CUDA:https://developer.nvidia.com/cuda-12-2-0-download-archive
cuDNN:https://developer.nvidia.com/rdp/cudnn-archive
※参考:CUDAのver切り替え:https://michyo.net/sempetit/install-cuda-multi-versions/

ss

色々パラメータ試してみたもののきれいにレイヤー分割するのがなかなか難しい。
一番はパーツ毎に分けられるといいのだけれども
(これはもしかすると立ち絵の方があまりよくないか?色調変化が大きい絵の方がいいのかも)

ss

Segment実行してからPSD実行したいけどそもそもSegmentがデフォルト値で全然計算が終わらない
CPUもGPUも全然使ってなさそうだけど

ss

仕事終わってみてもまだ計算中だった
これ動いてなさそうだしコード追っていくしかないか

ss

iPhone届いたのでtalking-head-anime-3-demoを試してみるとそこそこ動いた。
細かい顔のパーツごとの動きなんかは無理だけど一番省エネなのは生成AIで一枚絵作ってこれで動かすのが今のところ一番省エネでFAかな。

このスクラップは13日前にクローズされました