😸

J-MoshiをGoogleColab(L4)で動かす

2025/01/24に公開

お疲れ様です、波浪です。

なめらかに会話できるAIとして社内でちょっと話題になっていたj-moshiですが
おもろそうじゃんって思ったんで試してみました

親切に日本語解説が書いてあるので
ざっと見てみるとめっちゃ簡単に実行できそう

pip install moshi
python -m moshi.server --hf-repo nu-dialogue/j-moshi-ext

のたった2Stepみたいです
ただ

実行には，24GB以上のVRAMを搭載したLinux GPUマシンが必要です．
MacOSには対応していません．

とのことだったので家のGPUマシン使おうとしたら嫁さんが三國無双オリジンしてたんで
Colabで実行してみました。

T4だとVRAM足りなそうなのでL4使います（L4は有料プランでしか使えませんので注意）

あとColabだとGradioかなんかに繋がないといけないんですが

実装の詳細は，オリジナルMoshiのリポジトリ
kyutai-labs/moshi を参照してください．

githubで指示されているmoshiのリポジトリをみたら、
そのものズバリ

python -m moshi.server [--gradio-tunnel] [--hf-repo kyutai/moshika-pytorch-bf16]

って --gradio-tunnelつけりゃええよ書いてありました、たすかるぅ〜

実行するとモデルDLに少々待たされたあとに
gradioのURLが発行されます

実行した動画をつけたいところなんですが
zennに動画アップする方法がわからんのでgifだけはっときますね

。。。と思ったら上限の3MB超えてたんですいませんがスクショだけ貼ります

まあ、動画なんてみなくても、やればめちゃくちゃ簡単に試せるので！！！
みんなもLet's j-moshi ！！！！！

株式会社ガラパゴス（有志）株式会社ガラパゴスのエンジニアを中心に情報発信をしている Publication です。各記事の内容は個人の意見であり、企業を代表するものではございません。