📝

GPU VRAM 24GBでギリギリ動く40BのLLMがあるぞ！（falcon-40B-3bit）

2023/06/15に公開

Hugging Face

LLM

tech

やり方を説明するとTheBlokeさんが書いた手順と一緒になるだけなので手短に。
以下の3bitモデルが24GBでも動かせるように実験的に作ったものだそうなので、試してみた、という記事です^^

モデル

実行環境

text-generation-webuiという、stable-diffusion-webuiのLLM版を目指して作られたツールがあるので、今回はこれを使いました。

簡単ですが、インストール方法は以下です。

git clone https://github.com/oobabooga/one-click-installers.git
cd one-click-installers
OOBABOOGA_FLAGS="--chat --listen --listen-host 0.0.0.0" bash ./start_linux.sh

＜中略＞

2023-06-15 10:05:46 INFO:Loading the extension "gallery"...
Running on local URL:  http://0.0.0.0:7860

To create a public link, set `share=True` in `launch()`.

はい、簡単です(^o^)