定額プランで高速開発を行う具体的方法
要旨
Qwen Code CLI(通称 QwenCoder)を、OpenAI互換エンドポイントとして提供される Cerebras Inference に向け、qwen-3-coder-480b
を使う最短手順と、定額プラン(Cerebras Code Pro/Max) での可否・上限をまとめます。Cerebras 側は公式に OpenAI 互換をうたっており、CLI からは環境変数を差し替えるだけで動きます。(inference-docs.cerebras.ai)
1. この記事の結論
-
QwenCoder(Qwen Code CLI)から Cerebras Inference をそのまま使える(OpenAI 互換)。
OPENAI_API_KEY / OPENAI_BASE_URL / OPENAI_MODEL
を設定するだけ。(inference-docs.cerebras.ai, GitHub) -
モデル ID は
qwen-3-coder-480b
。Cerebras 公式の対応モデル一覧に掲載(プレビュー扱い、目安 ~2000 tok/s)。(inference-docs.cerebras.ai) - 定額プラン(Cerebras Code)でも利用可能。Pro: $50/月(1日あたり最大 24M tokens)、Max: $200/月(同 120M tokens)。(Cerebras)
2. 前提と仕様(Cerebras 側)
-
モデルページの要点
- モデル ID:
qwen-3-coder-480b
- コンテキスト長: Free 64k / 有料 128k
- 速度目安: ~2000 tokens/sec
- 価格(従量課金の目安・探索用): 入力 $2/M, 出力 $2/M
- 「thinkingモード」は非対応(
<think></think>
は出ない)/strict: true
のツール呼び出しは未対応(標準の tool calling は可) - 推奨デコード設定:
temperature=0.7, top_p=0.8
いずれもモデル個別ページに記載。(inference-docs.cerebras.ai)
- モデル ID:
-
OpenAI 互換エンドポイント
Cerebras は OpenAI のクライアントライブラリ互換を公式に案内しています(ベース URL はhttps://api.cerebras.ai/v1
で一般的に利用)。(inference-docs.cerebras.ai, pipecat-docs.readthedocs.io) -
エンタープライズ
企業向けは月額サブスク(例: Growth は $1,500/月〜)が公開されています。(Cerebras)
3. 毎回設定不要で QwenCoder を Cerebras に向ける
3.1 Qwen Code CLI のインストール
Node.js v20+ が必要。
Qwen Code CLI をグローバルにインストールします:
npm install --global @qwen-code/qwen-code
インストール確認:
qwen --version
起動:
qwen
OpenAI を選択:
実際に入力してみる:
API が入力されていないためエラーが返ってくると思います。
.env
ラッパー(qwc
)で毎回設定不要にする
3.2 グローバル どのプロジェクトでも ホームの ~/.qwen/.env
を読み込んでから Qwen Code を起動するラッパーを用意します。
ポイント:API キーは .env
に置き、モデルとエンドポイントは必要に応じて ~/.qwen/settings.json
に固定するのがシンプルです。
.env
を作成
共通:ホーム Windows:
C:\Users\<User>\.qwen\.env
macOS :~/.qwen/.env
OPENAI_API_KEY=YOUR_CEREBRAS_API_KEY
OPENAI_BASE_URL=https://api.cerebras.ai/v1
OPENAI_MODEL=qwen-3-coder-480b
qwc
関数をプロファイルに追加
Windows(PowerShell)版:- プロファイル作成(全ホスト共通)
$dest = $PROFILE.CurrentUserAllHosts
$dir = Split-Path $dest
New-Item -ItemType Directory -Path $dir -Force | Out-Null
if (!(Test-Path $dest)) { New-Item -ItemType File -Path $dest -Force | Out-Null }
- 関数を追記(
qwc
で起動)
@'
# ---- Qwen Code wrapper: load ~/.qwen/.env then run "qwen" ----
function qwc {
$homeEnv = Join-Path $HOME ".qwen\.env"
if (Test-Path $homeEnv) {
Get-Content $homeEnv | ForEach-Object {
if ($_ -match '^\s*$' -or $_ -match '^\s*#') { return }
$kv = $_ -split '=', 2
$name = $kv[0].Trim()
$value = if ($kv.Count -gt 1) { $kv[1].Trim().Trim('"') } else { "" }
if ($name) { Set-Item -Path "Env:$name" -Value $value }
}
}
& qwen @Args # ← 呼び出し演算子で実行
}
# --------------------------------------------------------------
'@ | Add-Content -Path $dest -Encoding UTF8
- 反映 & 実行
. $dest
qwc
# Qwen 内で /stats → Base URL と Model を確認
(任意)qwen
という名前で起動したい場合:
Set-Alias -Scope Global qwen qwc
# 戻すとき → Remove-Item Alias:qwen
qwc
関数を ~/.zshrc
に追加
macOS(zsh)版:- 関数を追記
# ~/.zshrc
qwc () {
local ENVFILE="$HOME/.qwen/.env"
if [ -f "$ENVFILE" ]; then
set -a
. "$ENVFILE"
set +a
fi
command qwen "$@"
}
- 反映 & 実行
source ~/.zshrc
qwc
# Qwen 内で /stats → Base URL と Model を確認
(任意)qwen
で起動したい場合:
alias qwen='qwc'
3.3 起動
qwc
セッションのトークン上限は ~/.qwen/settings.json
などで {"sessionTokenLimit": 32000}
のように調整可能。/stats
で状況確認、/compress
や /clear
も使えます(README のガイドより)。(GitHub)
4. 定額プラン(Cerebras Code)は使える?
結論:使えます。Cerebras 公式ブログで、Cerebras Code Pro: $50/月(1日 24M tokens まで)、Cerebras Code Max: $200/月(1日 120M tokens まで) と明記されています(いずれも Qwen3-Coder を含む)。CLI からは上述の環境変数を Cerebras に向けるだけ。(Cerebras)
企業チームで一定以上の処理量が恒常的に必要なら、エンタープライズのサブスク(Growth など)も検討してください。(Cerebras)
5. 料金まわりのメモ
-
従量課金(探索価格の目安)
qwen-3-coder-480b
のモデルページには、入力/出力とも $2.00 / 100万トークンの表記があります(将来変更の可能性あり)。(inference-docs.cerebras.ai) -
サブスク(Cerebras Code)
使い勝手重視なら Pro($50/月, 24M tokens/日)、重めの開発や IDE 連携・マルチエージェントまで回すなら Max($200/月, 120M tokens/日) が公式案内です。(Cerebras)
6. まとめ
- QwenCoder から 環境変数を 3 つ(キー/ベース URL/モデル ID)セットするだけで、Cerebras の
qwen-3-coder-480b
をすぐ使える。(inference-docs.cerebras.ai, GitHub) - 速度・コンテキストともに強力(~2000 tok/s、128k コンテキストは有料ティア)。重いコード生成や長文編集に向く。(inference-docs.cerebras.ai)
- **定額プラン対応(Pro/Max)**で、日々の開発ワークロードを見積もりやすい。(Cerebras)
7. 参考リンク(公式)
- OpenAI 互換:Use the OpenAI Client Libraries with Cerebras Inference(公式ドキュメント)(inference-docs.cerebras.ai)
- モデル一覧:Supported Models(
qwen-3-coder-480b
の掲載あり)(inference-docs.cerebras.ai) - モデル詳細:Qwen 3 Coder 480B(仕様・価格・非thinking/推奨設定)(inference-docs.cerebras.ai)
- Cerebras Code の定額プラン:Introducing Cerebras Code / Qwen3 Coder 480B is Live(公式ブログ)(Cerebras)
- エンタープライズ価格(参考):Pricing - Cerebras (Cerebras)
- (任意で参照)Rate Limits(API レート制限)(inference-docs.cerebras.ai)
読んでいただきありがとうございました。誤りや補足があればコメントでお知らせください!
Discussion