🦙

ローカルLLM#2 "LLM-jp-4をM4 MacBook AirのOllamaで動かしてみた"

に公開

はじめに

前回はQwen3をOllamaで動かしました。
今回は日本語特化モデルのLLM-jp-4を同じ環境で動かして、Qwen3と比較します。
同じ質問を投げて、回答の違いを確認していきます。

この記事でやること

  • GGUFファイルのダウンロード
  • Modelfileの作成
  • Ollamaへの登録と起動
  • Qwen3と同じ質問を投げて比較
  • 基本的なコマンド操作の紹介

LLM-jp-4とは

国立情報学研究所を中心とした国内コンソーシアムが開発する日本語LLMです。
日本語の事前学習データを大量に使っているのが特徴です。
Qwen3は多言語モデルなので、日本語タスクでどう違うか気になっていました。

GGUFファイルのダウンロード

OllamaのライブラリにないモデルはGGUF形式で手動取得します。
GGUFはローカル推論向けに変換されたモデルのファイル形式で、Ollamaがネイティブに対応しています。
ダウンロード元はHugging Faceです。AIモデルを公開・共有するためのプラットフォームで、多くのオープンソースモデルが公開されています。

コマンド

# hfコマンドのインストール(huggingface-cliとして登録されます)
brew install huggingface-cli

# GGUFをダウンロード
hf download \
  mmnga-o/llm-jp-4-8b-thinking-gguf \
  llm-jp-4-8b-thinking-Q4_K_M.gguf \
  --local-dir ~/models/llm-jp-4

解説

--local-dirでダウンロード先を指定します。
Q4_K_Mは4bit量子化の一種です。
M4 MacBook Air 16GBなら8Bモデルも問題なく載ります。

実行画面

llm-jp-4-8b-thinking-Q4_K_M.gguf: 100%|████████████████████████████████████████████| 5.30G/5.30G [03:55<00:00, 22.6MB/s]
✓ Downloaded
  path: /Users/umezawaaoshi/models/llm-jp-4/llm-jp-4-8b-thinking-Q4_K_M.gguf

Modelfileの作成

OllamaにGGUFを登録するにはModelfileが必要です。
ModelfileはOllamaがモデルを読み込むための設定ファイルで、使用するGGUFのパスや動作パラメータを記述します。

コマンド

cat > ~/models/llm-jp-4/Modelfile << 'EOF'
FROM ./llm-jp-4-8b-thinking-Q4_K_M.gguf

PARAMETER stop "<|endoftext|>"
PARAMETER temperature 0.7
PARAMETER num_ctx 8192

SYSTEM """あなたは誠実で優秀な日本語アシスタントです。"""
EOF

解説

FROMにはGGUFのパスを書きます。
stopトークンはモデルが回答を終了するタイミングを示す特殊な文字列です。LLM-jp系は<|endoftext|>を使います。
temperatureは回答のランダム性を調整するパラメータです。0に近いほど一貫した回答になり、1に近いほど多様な回答になります。0.7は標準的な設定です。
num_ctxはコンテキスト長で、一度に処理できるトークン数の上限です。8192に設定しています。

Ollamaへの登録と起動

まず別のターミナルを開いてOllamaのサーバーを起動します。このターミナルは起動したままにしておきます。

コマンド

ollama serve

実行画面

Listening on 127.0.0.1:11434 (version 0.21.2)

元のターミナルに戻ってモデルを登録します。

コマンド

cd ~/models/llm-jp-4
ollama create llm-jp-4 -f Modelfile

実行画面

gathering model components 
copying file sha256:6b4db3d11ba95fc821aca556fa801c1c2cb9c32b96deb2c7f7c04ff612cf784c 100% 
parsing GGUF 
using existing layer sha256:6b4db3d11ba95fc821aca556fa801c1c2cb9c32b96deb2c7f7c04ff612cf784c 
creating new layer sha256:8b3c2b4715e1d552d63349f6d8ce5a3e0981fbb14f7d5ab589d576996d6b2a3a 
creating new layer sha256:8bc88e83d48df0ee9891c061a22e1f1afccd244850f17a7ed0a5b29bd575814e 
writing manifest 
success 

解説
cd ~/models/llm-jp-4でModelfileとGGUFファイルがあるディレクトリに移動します。
ollama createでOllamaにモデルを登録します。-f Modelfileで使用するModelfileを指定しています。

コマンド

ollama run llm-jp-4

実行画面

>>> 

プロンプトが出たら成功です。

実際に質問してみた

前回と同じ質問を投げました。

>>> 最新の量子力学の技術動向について教えてください。

LLM-jp-4の回答

**1. 大規模量子コンピュータ(Quantum Supremacy)の進展**  
- **Google Sycamore (2023‑24)**:53 qubit デバイスで「ランダム回路サンプリング」実験を再実施し、誤り訂正コードを組み
込んだハイブリッド回路をテスト中。  
- **IBM Quantum System Two**:127 qubit 超大型チップ(Eagle)を実装し、量子ビットの結合率とクロストーク低減に成功。
現在はエラーレート < 0.5% を目指す「Surface‑code」ベースのデモを行っている。  
- **IonQ & Honeywell (Quantinuum)**:トラップイオン方式で 32–48 qubit の高忠実度デバイスを提供し、化学シミュレーシ
ョン向けの「VQE」(Variational Quantum Eigensolver) パイプラインを商用化。  

**2. 量子エラー訂正(QEC)と耐障害性アーキテクチャ**  
- **表面コード (Surface Code)**:Google・IBM が 7‑qubit “distance‑3” コードを実装し、論理エラー率 10⁻³ 以下を実証

- **カラーコード / Bacon-Shor**:Microsoft Azure Quantum のプロジェクトで、軽量な測定回路を使った小規模 QEC デモが公
開。  
- **トポロジカルキュービット (Majorana Zero Modes)**:Microsoft と Delft University of Technology が 2024 年に 150 
nm スケールの材料合成に成功し、初期的な非破壊読み出しを報告(まだ実装段階)。  

**3. 量子センシング・測定技術**  
- **NVセンターマグネティックセンサー**:MIT と IBM Quantum が共同で、ナノメートルスケールの磁場分布マッピングを実現
。単一スピン感度 10⁻¹⁸ T/√Hz。  
- **光格子時計**:Sr‑87 系光格子時計が 2024 年に世界最高不確かさ 5×10⁻¹⁹ を達成し、GPS の時間同期精度向上へ応用検
討。  
- **量子イメージング**:東京大学とNTTが「量子エンタングルメント増幅」を利用した超高分解能顕微鏡を試作、従来の光学限
界を超える情報取得を示す。  

**4. 化学・材料シミュレーションへの応用**  
- **VQE と QPE(Quantum Phase Estimation)ハイブリッド**:IBM Research が分子エネルギー計算で VQE の前処理を行い、
QPE によって基底状態エネルギーを 0.1 mHa 精度で再現。  
- **量子機械学習 (QML)**:Google AI Quantum が「Quantum Kernel Estimation」を大規模データセットに適用し、画像分類タ
スクで古典的カーネルより 5% 高い汎化性能を示した。  

**5. 標準化・インフラ整備**  
- **OpenPulse / OpenQASM 3.0**:各メーカーが共通プログラミングモデルを採用し始め、クラウド上でのジョブスケジューリン
グが統一的に可能に。  
- **量子ネットワーク試験場(QKD)**:欧州連合の「Quantum Internet Flagship」プロジェクトで、200 km 光ファイバー上の
エンタングルメント配布とリピータレス鍵交換が実証済み。  

### 今後注目すべきポイント
| カテゴリ | キーワード | 期待効果 |
|----------|------------|-----------|
| ハードウェア | **高忠実度トラップイオン**, **超伝導 3D パッケージング** | 論理量子ビット数の飛躍的増加 |
| ソフトウェア | **自動エラー訂正スケジューラ**, **ハイブリッド VQE‑QPE フロー** | アプリケーション開発サイクル短縮
 |
| 材料科学 | **高温超伝導体 (HTS) キュービット**, **トップロジカル素材** | デバイスサイズ縮小と消費電力削減 |
| エコシステム | **量子クラウド統合プラットフォーム**, **標準化 API** | 産業横断的利用の敷居低下 |

---

#### まとめ(箇条書き)
- **大規模超伝導チップ**:Google/IBM が 50‑130 qubit デバイスでエラー率改善と QEC デモを実施。  
- **トラップイオンの高忠実度化**:IonQ・Quantinuum が化学シミュレーション向けに最適化された回路を提供。  
- **量子エラー訂正**:表面コード中心の実装が進み、論理ビットの概念実証が完了。  
- **量子センシング**:NVセンターや光格子時計が実用レベルの感度に到達し、医療・地球観測へ応用が拡大。  
- **アプリケーション層**:VQE+QPE ハイブリッドで分子エネルギー計算が本格化、QML が機械学習領域でも成果を上げ始めた


これらの流れは「量子優位性」から「実用的量子利得」への移行期にあり、ハードウェアとソフトウェアの協調的進化が鍵となり
ます。

Qwen3の回答(前回)

最新の量子力学の技術動向は、量子コンピューティング、量子通信、量子センサー、量子材料の分野で急速に進展しています。以下に主要なトレンドと最新の進展を整理します。

---

### **1. 量子コンピューティング(Quantum Computing)**
- **量子ビット(Qubit)の進化**  
  - **超伝導量子ビット**:IBMやGoogleが、超伝導量子デバイスのスケーラビリティを向上させています。IBMは2023年時点で
1,121量子ビットのチップを発表し、2024年には1,000万量子ビット規模のチップの開発に向けた計画を発表しました。
  - **トポロジカル量子ビット**:米国の大学や企業が、トポロジカル絶縁体を用いた量子ビットの実現に注力。これは、デコヒ
ーレンス(量子状態の崩壊)を防ぐための有望なアプローチです。
  - **量子エラー訂正**:GoogleやMicrosoftが、量子エラー訂正コード(例:表面コード)の実装を進め、大規模な量子コンピ
ュータの実現に向けた基盤を築いています。

- **量子アルゴリズムと応用**  
  - **ハイブリッド量子-古典アルゴリズム**:量子コンピュータと古典コンピュータを組み合わせたアルゴリズムが、薬物設計
や材料科学などに応用されています。
  - **量子シミュレーション**:量子コンピュータが、分子や物質の量子力学的挙動をシミュレーションし、化学反応や新素材の
設計に貢献しています。

---

### **2. 量子通信(Quantum Communication)**
- **量子暗号(Quantum Key Distribution: QKD)**  
  - **中国の「墨子号」衛星**:2023年には、地上と宇宙間の量子通信の実証実験を継続し、国際的な暗号通信ネットワークの構
築に向けた進展が見られます。
  - **欧州のQuantum Internet Project**:欧州委員会が推進する「Quantum Internet」プロジェクトでは、量子もつれを介した
国際的な通信ネットワークの実験が進んでいます。

- **量子ネットワークの拡大**  
  - **量子中継器(Quantum Repeater)**:長距離の量子通信を実現するための量子中継器の技術が進化。米国や欧州で実験が行
われています。

---

### **3. 量子センサー(Quantum Sensors)**
- **高精度測定技術**  
  - **重力波検出**:LIGOやVirgoなどでは、量子ノイズを抑えるための量子センサー(例:光の圧縮)を活用して重力波の検出
を高精度化。
  - **医学応用**:量子センサーは、MRIやがん検出などの医療分野で応用され、微細な磁場や温度変化の測定が可能に。

- **原子時計と磁場測定**  
  - **原子時計の進化**:量子力学を基にした原子時計は、GPSや通信ネットワークの精度向上に貢献しています。

---

### **4. 量子材料とデバイス**
- **トポロジカル絶縁体と超伝導体**  
  - 高度な量子デバイスの基盤となる材料の研究が進む。例:量子ビットの安定化や、量子コンピュータのハードウェアに必要な
超伝導体の開発。

- **量子ドットとナノ構造**  
  - 半導体量子ドットは、量子コンピュータや量子通信デバイスの構成要素として注目されており、2023年には新しい量子ドット
の製造技術が報告されています。

---

### **5. 量子技術の応用分野**
- **エネルギー分野**  
  - 量子シミュレーションを用いた新素材(例:超電導材料やバッテリー)の設計が進展。
- **環境科学**  
  - 量子センサーを用いた気候変動のモニタリングや、地下水の探査が試みられている。
- **金融とセキュリティ**  
  - 量子暗号技術が金融取引や個人情報保護の分野で実用化の検討が進む。

---

### **6. 国際的な競争と協力**
- **米国・中国・欧州の技術戦略**  
  - 米国は「National Quantum Initiative」、中国は「量子技術革新計画」、欧州は「Quantum Flagship」を推進。国際的な競
争が激化しています。
- **国際共同研究**  
  - 量子通信ネットワークや量子コンピュータの国際共同プロジェクトが進展(例:EUのQuantum Internet Initiative)。

---

### **課題と今後の展望**
- **デコヒーレンスの克服**:量子ビットの安定性を高める技術の開発が急務。
- **スケーラビリティ**:大規模な量子コンピュータの実現には、ハードウェアとソフトウェアの両面での技術革新が求められる

- **倫理とセキュリティ**:量子技術がもたらす新たなリスク(例:量子コンピュータによる暗号解読)に対応するための規制・
倫理ガイドラインの検討が進んでいる。

---

### **まとめ**
量子力学の技術は、コンピューティング、通信、センサー、材料の分野で多岐にわたる応用が進んでおり、今後は実用化と国際競
争が加速する可能性があります。技術の進展に伴い、倫理的・社会的な課題も重要なテーマとなるでしょう

感想

LLM-jp-4の方が技術的な具体性が高い回答でした。
NVセンターの感度や光格子時計の不確かさなど、具体的な数値が含まれており、
情報も比較的新しい印象です。
Qwen3は整理が丁寧で読みやすい一方、情報が2023年頃で止まっており、
IBMの量子ビット数など事実と異なる記述も見られました。
専門的な質問に対してはLLM-jp-4の方が参考になりそうです。
応答速度は両者ほぼ同じでした。
ただし情報の正確性は両者とも別途検証が必要です。

基本的なコマンド操作

Ollamaでよく使うコマンドをまとめます。

モデル一覧の確認

ollama list
NAME               ID              SIZE      MODIFIED       
llm-jp-4:latest    5d784b83517a    5.3 GB    12 minutes ago    
qwen3:8b           500a1f067a9f    5.2 GB    3 days ago 

会話のリセット

対話中に/clearを入力するとコンテキストがリセットされます。
モデルは終了せず、そのまま新しい会話を始められます。

>>> /clear
Cleared session context

対話の終了

>>> /bye

Ctrl+Dでも終了できます。

モデルの削除

ollama rm llm-jp-4
deleted 'llm-jp-4'

実行中のモデルの確認

ollama ps
NAME               ID              SIZE      PROCESSOR    CONTEXT    UNTIL              
llm-jp-4:latest    5d784b83517a    6.5 GB    100% GPU     8192       4 minutes from now  

モデルはデフォルトで5分間アイドル状態が続くとメモリから解放されます。

まとめ:実行したコマンド一覧

# hfコマンドのインストール(huggingface-cliとして登録されます)
brew install huggingface-cli
 
# GGUFのダウンロード
hf download \
  mmnga-o/llm-jp-4-8b-thinking-gguf \
  llm-jp-4-8b-thinking-Q4_K_M.gguf \
  --local-dir ~/models/llm-jp-4
 
# Ollamaサーバーの起動(別ターミナルで実行)
ollama serve
 
# Ollamaへの登録
cd ~/models/llm-jp-4
ollama create llm-jp-4 -f Modelfile
 
# 起動
ollama run llm-jp-4
 
# モデル一覧の確認
ollama list
 
# 実行中のモデルの確認
ollama ps
 
# モデルの削除
ollama rm llm-jp-4

次回予告

次回はQwen3・LLM-jp-4・Gemma3の3モデルに同じ質問を投げて回答を比較します。
技術的な質問から日常的な質問まで複数のパターンで試して、モデルの得意不得意を整理します。

Discussion