GPT-5 APIのストリーミング利用でVerify Organizationが必要になる条件と回避策
はじめに
GPT-5がリリースされたので、「よし、早速ストリーミングで試そう!」と意気込んでコードを書いたら…まさかの壁にぶつかりました。
それが Verify Organization(組織認証)必須 という制約です。
この記事では、
- どんな条件でこの制約に引っかかるのか
- 認証を回避する方法はあるのか
- 実際に動くサンプルコード
をまとめます。
ストリーミング有効で実行 → エラー発生
まずは、公式サンプル通りにストリーミングで呼び出してみます。
from openai import OpenAI
client = OpenAI()
stream = client.chat.completions.create(
model="gpt-5",
messages=[
{"role": "user", "content": "こんにちは!"}
],
stream=True
)
for chunk in stream:
if chunk.choices[0].delta.content is not None:
print(chunk.choices[0].delta.content, end="")
実行すると、こんなエラーが返ってきます。
openai.BadRequestError: Error code: 400
{
"error": {
"message": "Your organization must be verified to stream this model. Please go to: https://platform.openai.com/settings/organization/general and click on Verify Organization. If you just verified, it can take up to 15 minutes for access to propagate.",
"type": "invalid_request_error",
"param": "stream",
"code": "unsupported_value"
}
}
このエラーを要約すると次のようになります。
「このモデルをストリーミングで使うには、組織認証を済ませる必要があります」
…つれないですね😞
ストリーミングを無効化すると動く
同じモデルでも、ストリーミングを無効にすれば普通に動きます。
ただし、全レスポンスが生成されるまで待たされるので、UX的にはやや不満。
from openai import OpenAI
client = OpenAI()
completion = client.chat.completions.create(
model="gpt-5",
messages=[
{"role": "user", "content": "こんにちは!"}
]
)
print(completion.choices[0].message.content)
こんにちは!今日はどのようにお手伝いできますか?
モデルごとの制限
GPT-5ファミリには3種類ありますが、この制約を回避できるのは gpt-5-nano だけです。
また、gpt-5の非推論モデルである gpt-5-chat-latest も組織認証なしでも使えます。
モデル | ストリーム有効 | ストリーム無効 |
---|---|---|
gpt-5 | × | 〇 |
gpt-5-mini | × | 〇 |
gpt-5-nano | 〇 | 〇 |
gpt-5-chat-latest(非推論モデル) | 〇 | 〇 |
Verify Organization(組織認証) とは
OpenAIが導入している組織認証は、主に次の目的で行われます。
- 不正利用の防止
- 利用ポリシーの順守
- 高負荷機能(例: ストリーミング)の制限
認証には個人情報の提供が必要で、心理的ハードルを感じる人も少なくないでしょう。
もちろん、認証してしまえば全機能を使えるのですが、私はまだ様子見中です。
gpt-5 と gpt-5-chat-latest について
先ほど軽く触れましたが、gpt-5-chat-latest は gpt-5 の非推論バージョンのモデルです。それぞれの特徴は次の通りです。
-
gpt-5(推論モデル)
- 応答生成の前に、内部でより多くの「思考トークン」を使って推論する
- 複雑な問題の精度が高い
- その分、応答開始までの時間が長くなる
- 利用するにはVerify Organization(組織認証)が必須
-
gpt-5-chat-latest(非推論モデル)
- 推論ステップを簡略化して、直接的に答えを生成する
- 応答が速く、ストリーミングも早く始まる
- 複雑な論理や長期計算では間違いやすい
- Verify Organization(組織認証)なしでも利用可能
1Mトークンあたりの利用価格はどちらも同じです(下表参照)。
MODEL | INPUT | CACHED INPUT | OUTPUT |
---|---|---|---|
gpt-5 | $1.25 | $0.125 | $10.00 |
gpt-5-chat-latest | $1.25 | $0.125 | $10.00 |
gpt-4.1(参考) | $2.00 | $0.50 | $8.00 |
gpt-4o(参考) | $2.50 | $1.25 | $10.00 |
価格の面から想像すると、gpt-5-chat-latest は推論しないだけで、素の賢さ
はgpt-5と同じだと思われます。また、推論しない分、gpt-5-chat-latest はコスト面でも有利だと思われます。
各モデルの特徴についてはOpenAIの公式発表資料をご参照ください。
まとめ
- GPT-5 / GPT-5-mini はストリーミング利用に組織認証必須
- gpt-5-nano は例外で、認証なしでもストリーミング可能
- 非推論でいいなら、gpt-5-chat-latest は認証なしでストリーミング可能
- 認証を避けるなら「nano」または「ストリーミング無効」で利用
結論: 推論有効かつストリーミングを本格利用したいなら Verify Organizationを済ませるのが確実 です。推論が不要なら gpt-5-chat-latest が有力な選択肢になります。
開発目的や運用要件に合わせて、最適な選択をしてください。
それでは今回はこの辺で。
じゃあね、バイバイ😊
Discussion