🏃‍♀️

定額プランで高速開発を行う具体的方法

に公開

要旨
Qwen Code CLI(通称 QwenCoder)を、OpenAI互換エンドポイントとして提供される Cerebras Inference に向け、qwen-3-coder-480b を使う最短手順と、定額プラン(Cerebras Code Pro/Max) での可否・上限をまとめます。Cerebras 側は公式に OpenAI 互換をうたっており、CLI からは環境変数を差し替えるだけで動きます。(inference-docs.cerebras.ai)


1. この記事の結論

  • QwenCoder(Qwen Code CLI)から Cerebras Inference をそのまま使える(OpenAI 互換)。OPENAI_API_KEY / OPENAI_BASE_URL / OPENAI_MODEL を設定するだけ。(inference-docs.cerebras.ai, GitHub)
  • モデル ID は qwen-3-coder-480b。Cerebras 公式の対応モデル一覧に掲載(プレビュー扱い、目安 ~2000 tok/s)。(inference-docs.cerebras.ai)
  • 定額プラン(Cerebras Code)でも利用可能Pro: $50/月(1日あたり最大 24M tokens)Max: $200/月(同 120M tokens)。(Cerebras)

2. 前提と仕様(Cerebras 側)

  • モデルページの要点

    • モデル ID: qwen-3-coder-480b
    • コンテキスト長: Free 64k / 有料 128k
    • 速度目安: ~2000 tokens/sec
    • 価格(従量課金の目安・探索用): 入力 $2/M, 出力 $2/M
    • 「thinkingモード」は非対応<think></think>は出ない)/strict: true のツール呼び出しは未対応(標準の tool calling は可)
    • 推奨デコード設定: temperature=0.7, top_p=0.8
      いずれもモデル個別ページに記載。(inference-docs.cerebras.ai)
  • OpenAI 互換エンドポイント
    Cerebras は OpenAI のクライアントライブラリ互換を公式に案内しています(ベース URL は https://api.cerebras.ai/v1 で一般的に利用)。(inference-docs.cerebras.ai, pipecat-docs.readthedocs.io)

  • エンタープライズ
    企業向けは月額サブスク(例: Growth は $1,500/月〜)が公開されています。(Cerebras)


3. 毎回設定不要で QwenCoder を Cerebras に向ける

3.1 Qwen Code CLI のインストール

Node.js v20+ が必要。

Qwen Code CLI をグローバルにインストールします:

npm install --global @qwen-code/qwen-code

インストール確認:

qwen --version

起動:

qwen

OpenAI を選択:

実際に入力してみる:

API が入力されていないためエラーが返ってくると思います。

3.2 グローバル .env ラッパー(qwc)で毎回設定不要にする

どのプロジェクトでも ホームの ~/.qwen/.env を読み込んでから Qwen Code を起動するラッパーを用意します。
ポイント:API キーは .env に置き、モデルとエンドポイントは必要に応じて ~/.qwen/settings.json に固定するのがシンプルです。

共通:ホーム .env を作成

Windows: C:\Users\<User>\.qwen\.env
macOS : ~/.qwen/.env

OPENAI_API_KEY=YOUR_CEREBRAS_API_KEY
OPENAI_BASE_URL=https://api.cerebras.ai/v1
OPENAI_MODEL=qwen-3-coder-480b

Windows(PowerShell)版:qwc 関数をプロファイルに追加

  1. プロファイル作成(全ホスト共通)
$dest = $PROFILE.CurrentUserAllHosts
$dir  = Split-Path $dest
New-Item -ItemType Directory -Path $dir -Force | Out-Null
if (!(Test-Path $dest)) { New-Item -ItemType File -Path $dest -Force | Out-Null }
  1. 関数を追記(qwc で起動)
@'
# ---- Qwen Code wrapper: load ~/.qwen/.env then run "qwen" ----
function qwc {
  $homeEnv = Join-Path $HOME ".qwen\.env"
  if (Test-Path $homeEnv) {
    Get-Content $homeEnv | ForEach-Object {
      if ($_ -match '^\s*$' -or $_ -match '^\s*#') { return }
      $kv = $_ -split '=', 2
      $name  = $kv[0].Trim()
      $value = if ($kv.Count -gt 1) { $kv[1].Trim().Trim('"') } else { "" }
      if ($name) { Set-Item -Path "Env:$name" -Value $value }
    }
  }
  & qwen @Args   # ← 呼び出し演算子で実行
}
# --------------------------------------------------------------
'@ | Add-Content -Path $dest -Encoding UTF8
  1. 反映 & 実行
. $dest
qwc
# Qwen 内で /stats → Base URL と Model を確認

(任意)qwen という名前で起動したい場合:

Set-Alias -Scope Global qwen qwc
# 戻すとき → Remove-Item Alias:qwen

macOS(zsh)版:qwc 関数を ~/.zshrc に追加

  1. 関数を追記
# ~/.zshrc
qwc () {
  local ENVFILE="$HOME/.qwen/.env"
  if [ -f "$ENVFILE" ]; then
    set -a
    . "$ENVFILE"
    set +a
  fi
  command qwen "$@"
}
  1. 反映 & 実行
source ~/.zshrc
qwc
# Qwen 内で /stats → Base URL と Model を確認

(任意)qwen で起動したい場合:

alias qwen='qwc'

3.3 起動

qwc


セッションのトークン上限は ~/.qwen/settings.json などで {"sessionTokenLimit": 32000} のように調整可能。/stats で状況確認、/compress/clear も使えます(README のガイドより)。(GitHub)


4. 定額プラン(Cerebras Code)は使える?

結論:使えます。Cerebras 公式ブログで、Cerebras Code Pro: $50/月(1日 24M tokens まで)Cerebras Code Max: $200/月(1日 120M tokens まで) と明記されています(いずれも Qwen3-Coder を含む)。CLI からは上述の環境変数を Cerebras に向けるだけ。(Cerebras)

企業チームで一定以上の処理量が恒常的に必要なら、エンタープライズのサブスク(Growth など)も検討してください。(Cerebras)


5. 料金まわりのメモ

  • 従量課金(探索価格の目安)
    qwen-3-coder-480b のモデルページには、入力/出力とも $2.00 / 100万トークンの表記があります(将来変更の可能性あり)。(inference-docs.cerebras.ai)

  • サブスク(Cerebras Code)
    使い勝手重視なら Pro($50/月, 24M tokens/日)、重めの開発や IDE 連携・マルチエージェントまで回すなら Max($200/月, 120M tokens/日) が公式案内です。(Cerebras)


6. まとめ

  • QwenCoder から 環境変数を 3 つ(キー/ベース URL/モデル ID)セットするだけで、Cerebras の qwen-3-coder-480b をすぐ使える。(inference-docs.cerebras.ai, GitHub)
  • 速度・コンテキストともに強力(~2000 tok/s、128k コンテキストは有料ティア)。重いコード生成や長文編集に向く。(inference-docs.cerebras.ai)
  • **定額プラン対応(Pro/Max)**で、日々の開発ワークロードを見積もりやすい。(Cerebras)

7. 参考リンク(公式)

  • OpenAI 互換:Use the OpenAI Client Libraries with Cerebras Inference(公式ドキュメント)(inference-docs.cerebras.ai)
  • モデル一覧:Supported Modelsqwen-3-coder-480b の掲載あり)(inference-docs.cerebras.ai)
  • モデル詳細:Qwen 3 Coder 480B(仕様・価格・非thinking/推奨設定)(inference-docs.cerebras.ai)
  • Cerebras Code の定額プラン:Introducing Cerebras Code / Qwen3 Coder 480B is Live(公式ブログ)(Cerebras)
  • エンタープライズ価格(参考):Pricing - Cerebras (Cerebras)
  • (任意で参照)Rate Limits(API レート制限)(inference-docs.cerebras.ai)

読んでいただきありがとうございました。誤りや補足があればコメントでお知らせください!

Discussion