🧑💻
OpenAIのオープンウェイトモデル「GPT-OSS-20B」をAzureのVMでサクッと試そう
GPT-OSS-20Bについて
GPT-OSS-20Bは、OpenAIが2025年8月にリリースしたオープンウェイト(重みが公開されている)大規模言語モデル。
エッジデバイスでの推論、プライベート環境での運用、ファインチューニングによるカスタマイズなど、様々な用途が期待できる。
- メモリ要件:16GBで動作可(ローカル/エッジ向け)。OpenAI公式が「gpt-oss-20b は 16GB のメモリで動く」と明記。
- コンテキスト長:最大 128k tokens。
- モデル仕様:**約21B params(3.6B active)**のMoE。([Hugging Face][2])
- 配布形態:Apache 2.0のオープンウェイト(商用利用可)。([オープンAI][3], [Ollama][4])
-
Ollama対応:Ollama公式ライブラリに
gpt-oss:20b
が公開(約14GB、MXFP4量子化)。([Ollama][5])
「VRAM 16GBのGPU」「ディスク ~14–15GB」が最低ライン。
現実的な最小構成のVMを選ぶ
最小で現実的なのは NCas T4 v3 シリーズ。T4 はVRAM 16GBで要件ピッタリ。
選択したのは Standard_NC4as_T4_v3(vCPU 4 / RAM 28GiB / T4)。
1時間稼働させて45円ほどとお財布に優しい。
-
Standard_NC4as_T4_v3(Japan East)
- GPU: NVIDIA T4 VRAM 16G)
- vCPU: 4 / メモリ: 28GiB
- Spotでも作成可
- 約 $0.3 / 時間
3. Azure で VM を用意
3.1 VM 作成
タブ | 項目 | 入力・選択値(例) | 参考 |
---|---|---|---|
基本 | リソース グループ | rg-oss20b | 何でもOK |
基本 | 仮想マシン名 | oss20b-t4 | 何でもOK |
基本 | リージョン | Japan East (japaneast) | 初期状態だとSpotのクォータが足りないかも。 |
基本 | イメージ | Ubuntu Server 24.04 LTS – Gen2(Canonical) | Canonical 公式イメージ。 |
基本 | サイズ | Standard_NC4as_T4_v3 | T4(16GB)搭載のNCas T4 v3。 |
基本 | 認証の種類 | SSH 公開キー | Portalで公開鍵を貼付またはAzureに保存済み鍵を選択。 |
基本 | ユーザー名 | 例:azureuser | ー |
基本 | Azure Spot 仮想マシン | オン | Spotは容量不足や価格条件などのMicrosoft側の都合でVMが落とされる。 |
ネットワーク | パブリック受信ポート | 選択したポートを許可 → SSH(22) | 既定は「なし」なので、外部からSSHするなら明示許可。 |
Azure Portal からポチポチ設定。
クオータが足りない場合はサポートからリクエストすれば3分ほどで承認されるはず。
- Spotは容量逼迫や価格条件でMicrosoftの都合でいつでも落とされうる点に注意。
3.2 GPUドライバインストール(Ubuntu 24.04)
sudo apt update
sudo apt install -y ubuntu-drivers-common
sudo ubuntu-drivers autoinstall
sudo reboot
再ログイン後 nvidia-smi
が通ればOK。
4. Ollama を入れて GPT-OSS-20B を走らせる
4.1 インストール & サービス起動
curl -fsSL https://ollama.com/install.sh | sh
sudo systemctl enable --now ollama
4.2 モデル取得&実行
# 最初の1回だけはモデルをPullするため時間がかかる。
ollama run gpt-oss:20b "日本語で自己紹介して。"
結果↓
こんにちは!
私はChatGPT、OpenAIが開発した大規模言語モデルです。
好きなことは、さまざまな言語で文章を書いたり、質問に答えたり、アイデアを練ったりすることです。
日本語や英語だけでなく、複数の言語でのコミュニケーションが得意です。
あなたの質問やリクエストにできる限りお応えしますので、気軽にどうぞ!
2回目以降は、結果が全て生成されるまでの時間はおよそ15秒ほど。体感ではとてもサクサク。
生成の動画はこちら↓
Discussion