😸
J-MoshiをGoogleColab(L4)で動かす
お疲れ様です、波浪です。
なめらかに会話できるAIとして社内でちょっと話題になっていたj-moshiですが
おもろそうじゃんって思ったんで試してみました
リポジトリ類はここですね
親切に日本語解説が書いてあるので
ざっと見てみるとめっちゃ簡単に実行できそう
pip install moshi
python -m moshi.server --hf-repo nu-dialogue/j-moshi-ext
のたった2Stepみたいです
ただ
実行には,24GB以上のVRAMを搭載したLinux GPUマシンが必要です.
MacOSには対応していません.
とのことだったので家のGPUマシン使おうとしたら嫁さんが三國無双オリジンしてたんで
Colabで実行してみました。
T4だとVRAM足りなそうなのでL4使います(L4は有料プランでしか使えませんので注意)
あとColabだとGradioかなんかに繋がないといけないんですが
実装の詳細は,オリジナルMoshiのリポジトリ
kyutai-labs/moshi を参照してください.
githubで指示されているmoshiのリポジトリをみたら、
そのものズバリ
python -m moshi.server [--gradio-tunnel] [--hf-repo kyutai/moshika-pytorch-bf16]
って --gradio-tunnelつけりゃええよ書いてありました、たすかるぅ〜
実行するとモデルDLに少々待たされたあとに
gradioのURLが発行されます
実行した動画をつけたいところなんですが
zennに動画アップする方法がわからんのでgifだけはっときますね
。。。と思ったら上限の3MB超えてたんで すいませんがスクショだけ貼ります
まあ、動画なんてみなくても、やればめちゃくちゃ簡単に試せるので!!!
みんなもLet's j-moshi !!!!!
GitHubで編集を提案
Discussion