🙄
gpt-oss-20b x Mem32G + RTX3060Ti 8G の環境では快適に動かなかったメモ(Ollama)
はじめに
OpenAIが、Open Modelsとして、モデル提供してくれるのは想像しておらず、とても素晴らしい取り組みだと思います。
gpt-oss-120b を MacBook M4 Max で動作できている方々(知人も含め)を見かけ、羨ましいところではありますが、まずは、現在の自環境で gpt-oss-20b が動作するかどうか試してみました。
試した環境
- OS: Windows11
- CPU: i7-11700
- Mem: 32GB(DDR4-3200)
- GPU: NVIDIA GeForce RTX 3060 Ti 8GB
- Ollama + gpt-oss-20b
結論
- 本環境では、レスポンス生成が遅く使い物にならない
- レスポンス生成中に、何もせずに待っていればレスポンスはエラーにならず出力される
- しかし、レスポンス生成中に、別のWindowsアプリケーションを利用しているとエラーが発生し、他のアプリケーションの動作が不安定な状態になる
実際に利用中に発生したエラー
- レスポンス生成中にWindowsアプリケーションを操作していたら発生
- メモリ不足ですね…
エラーログの確認
- ログディレクトリは、タスクトレイの Ollama から "View logs" を選択してディレクトリを表示
- C:\Users\ユーザ名\AppData\Local\Ollama\app.log
msg="chat stream error" error="an error was encountered while running the model: GGML_ASSERT(ctx->mem_buffer != NULL) failed"
msg="chat stream error" error="model runner has unexpectedly stopped, this may be due to resource limitations or an internal error, check ollama server logs for details"
環境構築メモ
ラマのアイコンがかわいいので、Ollamaを利用します。
実際には、インストールから動作確認まで15分ぐらいで完了します。
Ollama + gpt-oss-20b のインストール
- https://ollama.com/ から Windows版のダウンロード
- OllamaSetup.exe を実行するとインストールが開始
- ファルダ選択とかはできず、以下にインストールされる
- C:\Users\ユーザ名\AppData\Local\Programs\Ollama
OllamaSetup.exe インストール中
必要な Runtime インストール中
インストール後に Ollama 画面が起動
- gpt-oss-20b モデルを選択して会話するとモデルのダウンロードが自動的に開始
- デフォルト格納先は、C:\Users\ユーザ名\.ollama
- 左メニューの Settings で "Model location" を変更できる
gpt-oss-20b を自動ダウンロード中
- レスポンス生成
- 専用 GPU メモリ + 共有 GPU メモリ ではまだ余裕があるように見えるが…
レスポンスに 5.9秒…
タスクマネージャの状況
- 専用 GPU メモリ + 共有 GPU メモリ ではまだ余裕があるように見えるが…
- コマンドプロンプトで確認
> ollama --version ollama version is 0.11.4 > ollama ps NAME ID SIZE PROCESSOR CONTEXT UNTIL gpt-oss:20b e95023cf3b7b 14 GB 57%/43% CPU/GPU 4096 2 minutes from now
- その他
- スタートアップに Ollama ショートカットが登録されているので、必要ない場合は削除
必要なディスクサイズ
- Ollama: 3.94GB - C:\Users\ユーザ名\AppData\Local\Programs\Ollama
- gpt-oss-20b: 12.8GB - C:\Users\ユーザ名.ollama
まとめ
残念ながら、自身の現環境では快適に動作させることはできませんでした。
しかし、エンタープライズ開発においては、インターネット環境にデータが出せないセキュアな環境で生成AIを活用したいニーズがあるので、精度が良い生成AIの選択肢が増えることは非常に喜ばしいことです。
Discussion