🧑‍💻

OpenAIのオープンウェイトモデル「GPT-OSS-20B」をAzureのVMでサクッと試そう

に公開

GPT-OSS-20Bについて

GPT-OSS-20Bは、OpenAIが2025年8月にリリースしたオープンウェイト(重みが公開されている)大規模言語モデル。
エッジデバイスでの推論、プライベート環境での運用、ファインチューニングによるカスタマイズなど、様々な用途が期待できる。

  • メモリ要件16GBで動作可(ローカル/エッジ向け)。OpenAI公式が「gpt-oss-20b は 16GB のメモリで動く」と明記。
  • コンテキスト長最大 128k tokens
  • モデル仕様:**約21B params(3.6B active)**のMoE。([Hugging Face][2])
  • 配布形態Apache 2.0のオープンウェイト(商用利用可)。([オープンAI][3], [Ollama][4])
  • Ollama対応:Ollama公式ライブラリに gpt-oss:20b が公開(約14GB、MXFP4量子化)。([Ollama][5])

VRAM 16GBのGPU」「ディスク ~14–15GB」が最低ライン。


現実的な最小構成のVMを選ぶ

最小で現実的なのは NCas T4 v3 シリーズ。T4 はVRAM 16GBで要件ピッタリ。
選択したのは Standard_NC4as_T4_v3(vCPU 4 / RAM 28GiB / T4)

1時間稼働させて45円ほどとお財布に優しい。

  • Standard_NC4as_T4_v3(Japan East)

    • GPU: NVIDIA T4 VRAM 16G)
    • vCPU: 4 / メモリ: 28GiB
    • Spotでも作成可
    • 約 $0.3 / 時間

3. Azure で VM を用意

3.1 VM 作成

タブ 項目 入力・選択値(例) 参考
基本 リソース グループ rg-oss20b 何でもOK
基本 仮想マシン名 oss20b-t4 何でもOK
基本 リージョン Japan East (japaneast) 初期状態だとSpotのクォータが足りないかも。
基本 イメージ Ubuntu Server 24.04 LTS – Gen2(Canonical) Canonical 公式イメージ。
基本 サイズ Standard_NC4as_T4_v3 T4(16GB)搭載のNCas T4 v3。
基本 認証の種類 SSH 公開キー Portalで公開鍵を貼付またはAzureに保存済み鍵を選択。
基本 ユーザー名 例:azureuser
基本 Azure Spot 仮想マシン オン Spotは容量不足や価格条件などのMicrosoft側の都合でVMが落とされる。
ネットワーク パブリック受信ポート 選択したポートを許可 → SSH(22) 既定は「なし」なので、外部からSSHするなら明示許可。

Azure Portal からポチポチ設定。
クオータが足りない場合はサポートからリクエストすれば3分ほどで承認されるはず。

  • Spot容量逼迫や価格条件でMicrosoftの都合でいつでも落とされうる点に注意。

3.2 GPUドライバインストール(Ubuntu 24.04)

sudo apt update
sudo apt install -y ubuntu-drivers-common
sudo ubuntu-drivers autoinstall
sudo reboot

再ログイン後 nvidia-smi が通ればOK。


4. Ollama を入れて GPT-OSS-20B を走らせる

4.1 インストール & サービス起動

curl -fsSL https://ollama.com/install.sh | sh
sudo systemctl enable --now ollama

4.2 モデル取得&実行

# 最初の1回だけはモデルをPullするため時間がかかる。
ollama run gpt-oss:20b "日本語で自己紹介して。"

結果↓

こんにちは!  
私はChatGPT、OpenAIが開発した大規模言語モデルです。  
好きなことは、さまざまな言語で文章を書いたり、質問に答えたり、アイデアを練ったりすることです。 
 
日本語や英語だけでなく、複数の言語でのコミュニケーションが得意です。  

あなたの質問やリクエストにできる限りお応えしますので、気軽にどうぞ!

2回目以降は、結果が全て生成されるまでの時間はおよそ15秒ほど。体感ではとてもサクサク。
生成の動画はこちら↓

https://x.com/rhyizm/status/1954787340762927155?s=46&t=C8C9-23Jkur8ls4hIvi1LA

Discussion