🐸

cyberagent calm2-7b-chat GPU試用

2024/07/16に公開

今回はcalm2-7b-chatを試用

  • サイバーエージェント社がHugging faceに公開したLLM
  • CC BY-SA 4.0ライセンス
  • 日本語学習を強化したモデルである(EnglishももちろんOK)

https://github.com/mi-kaneyon/jp_LLM_repos/tree/main/calm2-7b-chat_example

実行例

USER: 文字化けしているので改めて回答し直してください。
ASSISTANT: USER: 文字化けしているので改めて回答し直してください。
ASSISTANT: 文字化けしている場合は、お手数ですが以下のコマンドを試してみてください。

```bash
sudo apt update
sudo apt install -y gnupg2


このコマンドを実行すると、OpenSSHサーバーのパッケージがインストールされます。これにより、OpenSSHサーバーが起動し、サーバーへのSSH接続が可能になります。

試用所感

  • 7BでもVRAM試用は多め
  • 減らすように処理すれば、スピードアップも図れる(ほぼ即回答)
  • レスポンスは現在3モデルですが、カスタムすると早い
  • 精度(真偽)は質問の仕方を細かくする必要がありそう

スクリプト別 VRAM使用量比較

GPU VRAM Usage from github scripts

bvasemodel.pyの場合
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 545.29.06              Driver Version: 545.29.06    CUDA Version: 12.3     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  NVIDIA GeForce RTX 3090        Off | 00000000:10:00.0  On |                  N/A |
| 48%   62C    P2             132W / 350W |  21523MiB / 24576MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+
                                                                                         
+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|    0   N/A  N/A      3928      G   /usr/lib/xorg/Xorg                          297MiB |
|    0   N/A  N/A      4109      G   /usr/bin/gnome-shell                         83MiB |
|    0   N/A  N/A      7133      G   ...irefox/4539/usr/lib/firefox/firefox      157MiB |
|    0   N/A  N/A     50202      C   python                                    20956MiB |
+---------------------------------------------------------------------------------------+

short_calm.pyの場合

+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 545.29.06              Driver Version: 545.29.06    CUDA Version: 12.3     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  NVIDIA GeForce RTX 3090        Off | 00000000:10:00.0  On |                  N/A |
|  0%   52C    P8              52W / 350W |  14665MiB / 24576MiB |      4%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+
                                                                                         
+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|    0   N/A  N/A      3928      G   /usr/lib/xorg/Xorg                          303MiB |
|    0   N/A  N/A      4109      G   /usr/bin/gnome-shell                         76MiB |
|    0   N/A  N/A      7133      G   ...irefox/4539/usr/lib/firefox/firefox      176MiB |
|    0   N/A  N/A     60243      C   python                                    13992MiB |
|    0   N/A  N/A     62832      G   ...seed-version=20240715-050117.866000       65MiB |
+---------------------------------------------------------------------------------------+


22/Jul 2024

  • 人物検出・感想をのべるスクリプト追加

https://github.com/mi-kaneyon/jp_LLM_repos/tree/main/calm2-7b-chat_example

Discussion