🏃‍♀️

定額プランで高速開発を行う具体的方法

2025/08/18に公開

要旨
Qwen Code CLI（通称 QwenCoder）を、OpenAI互換エンドポイントとして提供される Cerebras Inference に向け、qwen-3-coder-480b を使う最短手順と、定額プラン（Cerebras Code Pro/Max） での可否・上限をまとめます。Cerebras 側は公式に OpenAI 互換をうたっており、CLI からは環境変数を差し替えるだけで動きます。(inference-docs.cerebras.ai)

1. この記事の結論

QwenCoder（Qwen Code CLI）から Cerebras Inference をそのまま使える（OpenAI 互換）。OPENAI_API_KEY / OPENAI_BASE_URL / OPENAI_MODEL を設定するだけ。(inference-docs.cerebras.ai, GitHub)
モデル ID は qwen-3-coder-480b。Cerebras 公式の対応モデル一覧に掲載（プレビュー扱い、目安 ~2000 tok/s）。(inference-docs.cerebras.ai)
定額プラン（Cerebras Code）でも利用可能。Pro: $50/月（1日あたり最大 24M tokens）、Max: $200/月（同 120M tokens）。(Cerebras)

2. 前提と仕様（Cerebras 側）

モデルページの要点
- モデル ID: qwen-3-coder-480b
- コンテキスト長: Free 64k / 有料 128k
- 速度目安: ~2000 tokens/sec
- 価格（従量課金の目安・探索用）: 入力 $2/M, 出力 $2/M
- 「thinkingモード」は非対応（<think></think>は出ない）／strict: true のツール呼び出しは未対応（標準の tool calling は可）
- 推奨デコード設定: temperature=0.7, top_p=0.8
  いずれもモデル個別ページに記載。(inference-docs.cerebras.ai)
OpenAI 互換エンドポイント
Cerebras は OpenAI のクライアントライブラリ互換を公式に案内しています（ベース URL は https://api.cerebras.ai/v1 で一般的に利用）。(inference-docs.cerebras.ai, pipecat-docs.readthedocs.io)
エンタープライズ
企業向けは月額サブスク（例: Growth は $1,500/月〜）が公開されています。(Cerebras)

3. 毎回設定不要で QwenCoder を Cerebras に向ける

3.1 Qwen Code CLI のインストール

Node.js v20+ が必要。

Qwen Code CLI をグローバルにインストールします：

npm install --global @qwen-code/qwen-code

インストール確認：

qwen --version

起動：

qwen

OpenAI を選択：

実際に入力してみる：

API が入力されていないためエラーが返ってくると思います。

3.2 グローバル `.env` ラッパー（`qwc`）で毎回設定不要にする

どのプロジェクトでも ホームの ~/.qwen/.env を読み込んでから Qwen Code を起動するラッパーを用意します。
ポイント：API キーは .env に置き、モデルとエンドポイントは必要に応じて ~/.qwen/settings.json に固定するのがシンプルです。

共通：ホーム `.env` を作成

Windows: C:\Users\<User>\.qwen\.env
macOS : ~/.qwen/.env

OPENAI_API_KEY=YOUR_CEREBRAS_API_KEY
OPENAI_BASE_URL=https://api.cerebras.ai/v1
OPENAI_MODEL=qwen-3-coder-480b

Windows（PowerShell）版：`qwc` 関数をプロファイルに追加

プロファイル作成（全ホスト共通）

$dest = $PROFILE.CurrentUserAllHosts
$dir  = Split-Path $dest
New-Item -ItemType Directory -Path $dir -Force | Out-Null
if (!(Test-Path $dest)) { New-Item -ItemType File -Path $dest -Force | Out-Null }

関数を追記（qwc で起動）

@'
# ---- Qwen Code wrapper: load ~/.qwen/.env then run "qwen" ----
function qwc {
  $homeEnv = Join-Path $HOME ".qwen\.env"
  if (Test-Path $homeEnv) {
    Get-Content $homeEnv | ForEach-Object {
      if ($_ -match '^\s*$' -or $_ -match '^\s*#') { return }
      $kv = $_ -split '=', 2
      $name  = $kv[0].Trim()
      $value = if ($kv.Count -gt 1) { $kv[1].Trim().Trim('"') } else { "" }
      if ($name) { Set-Item -Path "Env:$name" -Value $value }
    }
  }
  & qwen @Args   # ← 呼び出し演算子で実行
}
# --------------------------------------------------------------
'@ | Add-Content -Path $dest -Encoding UTF8

反映 & 実行

. $dest
qwc
# Qwen 内で /stats → Base URL と Model を確認

（任意）qwen という名前で起動したい場合：

Set-Alias -Scope Global qwen qwc
# 戻すとき → Remove-Item Alias:qwen

macOS（zsh）版：`qwc` 関数を `~/.zshrc` に追加

関数を追記

# ~/.zshrc
qwc () {
  local ENVFILE="$HOME/.qwen/.env"
  if [ -f "$ENVFILE" ]; then
    set -a
    . "$ENVFILE"
    set +a
  fi
  command qwen "$@"
}

反映 & 実行

source ~/.zshrc
qwc
# Qwen 内で /stats → Base URL と Model を確認

（任意）qwen で起動したい場合：

alias qwen='qwc'

3.3 起動

qwc

セッションのトークン上限は ~/.qwen/settings.json などで {"sessionTokenLimit": 32000} のように調整可能。/stats で状況確認、/compress や /clear も使えます（README のガイドより）。(GitHub)

4. 定額プラン（Cerebras Code）は使える？

結論：使えます。Cerebras 公式ブログで、Cerebras Code Pro: $50/月（1日 24M tokens まで）、Cerebras Code Max: $200/月（1日 120M tokens まで） と明記されています（いずれも Qwen3-Coder を含む）。CLI からは上述の環境変数を Cerebras に向けるだけ。(Cerebras)

企業チームで一定以上の処理量が恒常的に必要なら、エンタープライズのサブスク（Growth など）も検討してください。(Cerebras)

5. 料金まわりのメモ

従量課金（探索価格の目安）
qwen-3-coder-480b のモデルページには、入力/出力とも $2.00 / 100万トークンの表記があります（将来変更の可能性あり）。(inference-docs.cerebras.ai)
サブスク（Cerebras Code）
使い勝手重視なら Pro（$50/月, 24M tokens/日）、重めの開発や IDE 連携・マルチエージェントまで回すなら Max（$200/月, 120M tokens/日） が公式案内です。(Cerebras)

6. まとめ

QwenCoder から 環境変数を 3 つ（キー／ベース URL／モデル ID）セットするだけで、Cerebras の qwen-3-coder-480b をすぐ使える。(inference-docs.cerebras.ai, GitHub)
速度・コンテキストともに強力（~2000 tok/s、128k コンテキストは有料ティア）。重いコード生成や長文編集に向く。(inference-docs.cerebras.ai)
**定額プラン対応（Pro/Max）**で、日々の開発ワークロードを見積もりやすい。(Cerebras)

7. 参考リンク（公式）

OpenAI 互換：Use the OpenAI Client Libraries with Cerebras Inference（公式ドキュメント）(inference-docs.cerebras.ai)
モデル一覧：Supported Models（qwen-3-coder-480b の掲載あり）(inference-docs.cerebras.ai)
モデル詳細：Qwen 3 Coder 480B（仕様・価格・非thinking/推奨設定）(inference-docs.cerebras.ai)
Cerebras Code の定額プラン：Introducing Cerebras Code / Qwen3 Coder 480B is Live（公式ブログ）(Cerebras)
エンタープライズ価格（参考）：Pricing - Cerebras (Cerebras)
（任意で参照）Rate Limits（API レート制限）(inference-docs.cerebras.ai)

読んでいただきありがとうございました。誤りや補足があればコメントでお知らせください！