<h2 id="%E3%81%AF%E3%81%98%E3%82%81%E3%81%AB" data-line="0" class="code-line">
<a class="header-anchor-link" href="#%E3%81%AF%E3%81%98%E3%82%81%E3%81%AB" aria-hidden="true"></a> はじめに</h2>
この記事では、Docker Composeを使ってローカル環境で<a href="https://hub.docker.com/r/ollama/ollama" target="_blank" rel="nofollow noopener noreferrer">Ollama</a>を動かし、軽量かつ高性能なAIモデル「gpt-oss:20b」を試す手順を紹介します。最終的に、<a href="http://localhost:11434" target="_blank" rel="nofollow noopener noreferrer">http://localhost:11434</a> からAPIを呼び出して、AIの応答を得られる状態を目指します。これで、例えば自作アプリからAIを簡単に呼び出せるようになります！
<ul data-line="3" class="code-line">
<li data-line="3" class="code-line">
対象読者: Dockerを使った経験がある初級～中級エンジニア
</li>
<li data-line="4" class="code-line">
環境: macOS / Windows / Linux（Docker Desktop推奨）
</li>
<li data-line="5" class="code-line">
ゴール: ローカルでAPI（<code>/api/tags</code>, <code>/api/generate</code>）を叩いてAIを動かす
</li>
<li data-line="7" class="code-line">
構成: Docker Compose + Ollama + gpt-oss:20b（MXFP4）
</li>
<li data-line="8" class="code-line">
対象OS: macOS / Windows / Linux（Docker Desktop 推奨）
</li>
<li data-line="9" class="code-line">
参考: ネイティブOllamaアプリでも同等手順（後述）
</li>
<li data-line="10" class="code-line">
gpt-ossとは: <a href="https://openai.com/ja-JP/index/introducing-gpt-oss/" target="_blank" rel="nofollow noopener noreferrer">https://openai.com/ja-JP/index/introducing-gpt-oss/</a>
</li>
</ul>
<h2 id="0.-%E4%BA%8B%E5%89%8D%E6%BA%96%E5%82%99%EF%BC%9A%E3%83%A1%E3%83%A2%E3%83%AA%E3%81%A8%E3%83%A2%E3%83%87%E3%83%AB%E3%81%AE%E7%A2%BA%E8%AA%8D" data-line="12" class="code-line">
<a class="header-anchor-link" href="#0.-%E4%BA%8B%E5%89%8D%E6%BA%96%E5%82%99%EF%BC%9A%E3%83%A1%E3%83%A2%E3%83%AA%E3%81%A8%E3%83%A2%E3%83%87%E3%83%AB%E3%81%AE%E7%A2%BA%E8%AA%8D" aria-hidden="true"></a> 0. 事前準備：メモリとモデルの確認</h2>
<ul data-line="14" class="code-line">
<li data-line="14" class="code-line">
メモリ: <code>gpt-oss:20b</code>は約12.5GiBのメモリを消費します。Docker Desktopの設定で、メモリを18～22GBに増やしておくと安定します（設定方法: Docker Desktop &gt; 設定 &gt; リソース &gt; メモリ）。 
<img src="https://i.gyazo.com/398036e0c0b00f936c68f94efde94ab7.png" alt="Docker Desktopのメモリ設定" class="md-img" loading="lazy">
</li>
<li data-line="16" class="code-line">
キャプション: 「メモリを18～22GBに設定し、『Apply』をクリック！」</li>
<li data-line="17" class="code-line">
モデル: 一度Pullしたモデルはローカルに保存されるので、毎回ダウンロード不要。ストレージに約13GBの空きを確保してください。</li>
</ul>
<h2 id="1.-docker-compose%E3%81%A7ollama%E3%82%92%E8%B5%B7%E5%8B%95" data-line="19" class="code-line">
<a class="header-anchor-link" href="#1.-docker-compose%E3%81%A7ollama%E3%82%92%E8%B5%B7%E5%8B%95" aria-hidden="true"></a> 1. Docker ComposeでOllamaを起動</h2>
<ol data-line="21" class="code-line">
<li data-line="21" class="code-line">
空のディレクトリを作成（例: <code>mkdir ollama-test &amp;&amp; cd ollama-test</code>）。
</li>
<li data-line="23" class="code-line">
以下の内容を<code>compose.yaml</code>として保存。
<div class="code-block-container"><pre class="language-yaml"><code class="language-yaml code-line" data-line="24">services:
 ollama:
 image: ollama/ollama:latest
 ports:
 - "11434:11434" # ローカルのhttp://localhost:11434でOllamaのAPIにアクセス
 volumes:
 - ollama_data:/root/.ollama # モデルデータを永続化
 healthcheck:
 test: ["CMD-SHELL", "ollama list &gt;/dev/null 2&gt;&amp;1 || exit 1"]
 interval: 10s
 timeout: 5s
 retries: 20
volumes:
 ollama_data:
</code></pre></div>
</li>
<li data-line="40" class="code-line">
以下のコマンドで起動:
<div class="code-block-container"><pre class="language-bash"><code class="language-bash code-line" data-line="41">docker compose up -d
</code></pre></div>
</li>
<li data-line="44" class="code-line">
（任意）ログを確認:
<div class="code-block-container"><pre class="language-bash"><code class="language-bash code-line" data-line="45">docker compose logs -f ollama
</code></pre></div>
</li>
</ol>
補足: ポート11434はOllamaのAPIエンドポイントで、ホストから簡単にアクセスできます。
<h2 id="2.-%E3%83%A2%E3%83%87%E3%83%AB%E3%82%92pull%EF%BC%88%E5%88%9D%E5%9B%9E%E3%81%AE%E3%81%BF%EF%BC%89" data-line="51" class="code-line">
<a class="header-anchor-link" href="#2.-%E3%83%A2%E3%83%87%E3%83%AB%E3%82%92pull%EF%BC%88%E5%88%9D%E5%9B%9E%E3%81%AE%E3%81%BF%EF%BC%89" aria-hidden="true"></a> 2. モデルをPull（初回のみ）</h2>
<code>gpt-oss:20b</code>は約13GBのモデルです。初回は以下のコマンドでダウンロードします（所要時間はネットワーク速度次第で5～20分程度）。
<div class="code-block-container"><pre class="language-bash"><code class="language-bash code-line" data-line="54">docker compose exec ollama ollama pull gpt-oss:20b
</code></pre></div>ダウンロード済みか確認:
<div class="code-block-container"><pre class="language-bash"><code class="language-bash code-line" data-line="60">docker compose exec ollama ollama list
</code></pre></div>出力例:
<div class="code-block-container"><pre class="language-bash"><code class="language-bash code-line" data-line="66">NAME ID SIZE MODIFIED
gpt-oss:20b aa4295ac10c3 13 GB a few seconds ago
</code></pre></div>(任意)簡単な動作確認:
<div class="code-block-container"><pre class="language-bash"><code class="language-bash code-line" data-line="73">docker compose exec ollama ollama run gpt-oss:20b "hello"
</code></pre></div>注意: メモリ不足でエラー（HTTP 500）が発生した場合、Docker Desktopのメモリ設定を18～22GBに増やして再試行してください。
<h2 id="3.-api%E7%96%8E%E9%80%9A%E7%A2%BA%E8%AA%8D%EF%BC%88%E3%83%9B%E3%82%B9%E3%83%88%E3%81%8B%E3%82%89%E7%9B%B4%E6%8E%A5%EF%BC%89" data-line="79" class="code-line">
<a class="header-anchor-link" href="#3.-api%E7%96%8E%E9%80%9A%E7%A2%BA%E8%AA%8D%EF%BC%88%E3%83%9B%E3%82%B9%E3%83%88%E3%81%8B%E3%82%89%E7%9B%B4%E6%8E%A5%EF%BC%89" aria-hidden="true"></a> 3. API疎通確認（ホストから直接）</h2>
OllamaのAPIは<code>http://localhost:11434</code>で公開されています。<code>curl</code>や任意のHTTPクライアント（Python, Ruby, Node.jsなど）でテストできます。
<h3 id="%E3%83%A2%E3%83%87%E3%83%AB%E4%B8%80%E8%A6%A7%E3%81%AE%E5%8F%96%E5%BE%97" data-line="82" class="code-line">
<a class="header-anchor-link" href="#%E3%83%A2%E3%83%87%E3%83%AB%E4%B8%80%E8%A6%A7%E3%81%AE%E5%8F%96%E5%BE%97" aria-hidden="true"></a> モデル一覧の取得</h3>
<ul data-line="84" class="code-line">
<li data-line="84" class="code-line">
モデル一覧の確認 (<code>/api/tags</code>):
<div class="code-block-container"><pre class="language-bash"><code class="language-bash code-line" data-line="86"> curl -s http://localhost:11434/api/tags
</code></pre></div>
出力例:
<div class="code-block-container"><pre class="language-json"><code class="language-json code-line" data-line="92">{"models":[{"name":"gpt-oss:20b","modified_at":"2025-08-31T09:28:00Z","size":13000000000}]}
</code></pre></div>
</li>
</ul>
<h3 id="%E7%94%9F%E6%88%90%E3%83%AA%E3%82%AF%E3%82%A8%E3%82%B9%E3%83%88" data-line="96" class="code-line">
<a class="header-anchor-link" href="#%E7%94%9F%E6%88%90%E3%83%AA%E3%82%AF%E3%82%A8%E3%82%B9%E3%83%88" aria-hidden="true"></a> 生成リクエスト</h3>
<ul data-line="98" class="code-line">
<li data-line="98" class="code-line">
生成リクエスト (/api/generate, 非ストリーミング): シェルの引用エラーを避けるため、Here Docを使います。
<div class="code-block-container"><pre class="language-bash"><code class="language-bash code-line" data-line="100">cat &lt;&lt; 'JSON' | curl -sS -H "Content-Type: application/json" -d @- http://localhost:11434/api/generate
{
 "model": "gpt-oss:20b",
 "prompt": "say hello",
 "stream": false
}
JSON
</code></pre></div>
出力例:
<div class="code-block-container"><pre class="language-json"><code class="language-json code-line" data-line="112">{"model":"gpt-oss:20b","response":"Hello! How can I assist you today?","done":true}
</code></pre></div>
</li>
</ul>
<h2 id="4.-%E3%83%8D%E3%82%A4%E3%83%86%E3%82%A3%E3%83%96ollama%E3%82%A2%E3%83%97%E3%83%AA%E3%81%A7%E3%81%AE%E4%BB%A3%E6%9B%BF%E6%89%8B%E9%A0%86%EF%BC%88docker%E4%B8%8D%E8%A6%81%EF%BC%89" data-line="116" class="code-line">
<a class="header-anchor-link" href="#4.-%E3%83%8D%E3%82%A4%E3%83%86%E3%82%A3%E3%83%96ollama%E3%82%A2%E3%83%97%E3%83%AA%E3%81%A7%E3%81%AE%E4%BB%A3%E6%9B%BF%E6%89%8B%E9%A0%86%EF%BC%88docker%E4%B8%8D%E8%A6%81%EF%BC%89" aria-hidden="true"></a> 4. ネイティブOllamaアプリでの代替手順（Docker不要）</h2>
Dockerを使わず、<a href="https://ollama.ai/" target="_blank" rel="nofollow noopener noreferrer">Ollama公式アプリ</a> をインストール済みの場合、同等の操作が可能です。
<div class="code-block-container"><pre class="language-bash"><code class="language-bash code-line" data-line="119"># モデル実行（未インストールなら自動Pull）
ollama run gpt-oss:20b "hello"

# API確認（デフォルトでhttp://localhost:11434）
curl -s http://localhost:11434/api/tags
</code></pre></div><h2 id="5.-%E3%83%88%E3%83%A9%E3%83%96%E3%83%AB%E3%82%B7%E3%83%A5%E3%83%BC%E3%83%86%E3%82%A3%E3%83%B3%E3%82%B0" data-line="127" class="code-line">
<a class="header-anchor-link" href="#5.-%E3%83%88%E3%83%A9%E3%83%96%E3%83%AB%E3%82%B7%E3%83%A5%E3%83%BC%E3%83%86%E3%82%A3%E3%83%B3%E3%82%B0" aria-hidden="true"></a> 5. トラブルシューティング</h2>
<table data-line="128" class="code-line">
<thead data-line="128" class="code-line">
<tr data-line="128" class="code-line">
<th>問題</th>
<th>症状</th>
<th>解決方法</th>
</tr>
</thead>
<tbody data-line="130" class="code-line">
<tr data-line="130" class="code-line">
<td>メモリ不足</td>
<td>HTTP 500エラーやコンテナのクラッシュ</td>
<td>Docker Desktop &gt; Settings &gt; Resources &gt; Memoryを18～22GBに設定し、コンテナを再起動（<code>docker compose up -d</code>）。</td>
</tr>
<tr data-line="131" class="code-line">
<td>GPU未検出</td>
<td>ログに「no compatible GPUs were discovered」と表示</td>
<td>CPUでも動作可能。GPUが必要ならNVIDIA GPUとドライバを確認（<a href="https://ollama.ai/docs/gpu" target="_blank" rel="nofollow noopener noreferrer">公式ドキュメント</a>）。</td>
</tr>
<tr data-line="132" class="code-line">
<td>モデル未発見</td>
<td>
<code>ollama pull</code>が失敗、またはモデルが見つからない</td>
<td>モデル名（<code>gpt-oss:20b</code>）の綴りやネットワーク（プロキシ設定）を確認。</td>
</tr>
<tr data-line="133" class="code-line">
<td>シェルエラー</td>
<td>
<code>curl</code>コマンドで引用エラーが発生</td>
<td>Here Docを使用するか、JSONをファイルに保存して<code>-d @file.json</code>で送信。</td>
</tr>
</tbody>
</table>
<h2 id="6.-%E8%A3%9C%E8%B6%B3%EF%BC%9A%E3%83%A2%E3%83%87%E3%83%AB%E3%82%92docker%E3%82%A4%E3%83%A1%E3%83%BC%E3%82%B8%E3%81%AB%E5%90%AB%E3%82%81%E3%81%AA%E3%81%84%E7%90%86%E7%94%B1" data-line="135" class="code-line">
<a class="header-anchor-link" href="#6.-%E8%A3%9C%E8%B6%B3%EF%BC%9A%E3%83%A2%E3%83%87%E3%83%AB%E3%82%92docker%E3%82%A4%E3%83%A1%E3%83%BC%E3%82%B8%E3%81%AB%E5%90%AB%E3%82%81%E3%81%AA%E3%81%84%E7%90%86%E7%94%B1" aria-hidden="true"></a> 6. 補足：モデルをDockerイメージに含めない理由</h2>
<ul data-line="136" class="code-line">
<li data-line="136" class="code-line">
イメージの軽量化: モデルを含めるとイメージが巨大になり、ビルドや配布に時間がかかる。</li>
<li data-line="137" class="code-line">
柔軟性: モデルを環境変数やコマンドで簡単に切り替え可能。</li>
<li data-line="138" class="code-line">
効率性: 初回ダウンロード後はローカルにキャッシュされ、再利用可能。</li>
</ul>
<h2 id="7.-%E6%9C%80%E5%BE%8C%E3%81%AB" data-line="140" class="code-line">
<a class="header-anchor-link" href="#7.-%E6%9C%80%E5%BE%8C%E3%81%AB" aria-hidden="true"></a> 7. 最後に</h2>
上記手順でdocker composeを使用し、ローカル環境でAIが動くようになりました。次は、PythonやNode.jsなど好きな言語でAPIを呼び出して、AIをアプリに組み込んでみてください！
Happy coding!

Docker環境でgpt-ossを動かしてみた

0. 事前準備：メモリとモデルの確認

3. API疎通確認（ホストから直接）

4. ネイティブOllamaアプリでの代替手順（Docker不要）

6. 補足：モデルをDockerイメージに含めない理由

Discussion