🐷

ローカル LLM (Gemma 3 4B) セットアップ作業記録

2025/07/02に公開

執筆: ChatGPT, 編集: 昭和おじさん

環境: Ubuntu24 on WSL2 on Win11

✅ ゴール

最終的に以下のように移動・整理：

~/dev/llama.cpp  ← ビルド済み llama.cpp 本体
~/dev/llama.cpp/models/gemma-3-4b-it-q4_0.gguf  ← モデル本体

nvidia-smi                 # GPU認識（CUDAドライバOK）
nvcc --version             # CUDA Toolkitが有効
cmake --version            # v3.18 以上推奨

$ git clone https://github.com/ggerganov/llama.cpp.git
$ cd llama.cpp
$ cmake -B build -DGGML_CUDA=ON
$ cmake --build build --config Release

$ sudo apt install libcurl4-openssl-dev

$ cd models
$ wget https://huggingface.co/google/gemma-3-4b-it-qat-q4_0-gguf/resolve/main/gemma-3-4b-it-q4_0.gguf

→ 約 3.0GB の gemma-3-4b-it-q4_0.gguf を取得

llama-mtmd-cli はマルチモーダルようだった模様。

ERR: Missing --mmproj argument

$ ./build/bin/llama-cli \
  -m models/gemma-3-4b-it-q4_0.gguf \
  --chat-template gemma

→ >> プロンプト表示、自然な日本語で応答

>> はろにちは。 do you understand or use Japanese?
→ 日本語で自然な応答を確認