🥙

GPT-5 APIのストリーミング利用でVerify Organizationが必要になる条件と回避策

に公開

はじめに

GPT-5がリリースされたので、「よし、早速ストリーミングで試そう!」と意気込んでコードを書いたら…まさかの壁にぶつかりました。
それが Verify Organization(組織認証)必須 という制約です。

この記事では、

  • どんな条件でこの制約に引っかかるのか
  • 認証を回避する方法はあるのか
  • 実際に動くサンプルコード

をまとめます。

ストリーミング有効で実行 → エラー発生

まずは、公式サンプル通りにストリーミングで呼び出してみます。

sample1.py
from openai import OpenAI

client = OpenAI()

stream = client.chat.completions.create(
    model="gpt-5",
    messages=[
        {"role": "user", "content": "こんにちは!"}
    ],
    stream=True
)

for chunk in stream:
    if chunk.choices[0].delta.content is not None:
        print(chunk.choices[0].delta.content, end="")

実行すると、こんなエラーが返ってきます。

openai.BadRequestError: Error code: 400

エラー情報
{
    "error": {
        "message": "Your organization must be verified to stream this model. Please go to: https://platform.openai.com/settings/organization/general and click on Verify Organization. If you just verified, it can take up to 15 minutes for access to propagate.",
        "type": "invalid_request_error",
        "param": "stream",
        "code": "unsupported_value"
    }
}

このエラーを要約すると次のようになります。

「このモデルをストリーミングで使うには、組織認証を済ませる必要があります」

…つれないですね😞

ストリーミングを無効化すると動く

同じモデルでも、ストリーミングを無効にすれば普通に動きます。
ただし、全レスポンスが生成されるまで待たされるので、UX的にはやや不満。

sample2.py
from openai import OpenAI

client = OpenAI()

completion = client.chat.completions.create(
    model="gpt-5",
    messages=[
        {"role": "user", "content": "こんにちは!"}
    ]
)

print(completion.choices[0].message.content)
応答例
こんにちは!今日はどのようにお手伝いできますか?

モデルごとの制限

GPT-5ファミリには3種類ありますが、この制約を回避できるのは gpt-5-nano だけです。
また、gpt-5の非推論モデルである gpt-5-chat-latest も組織認証なしでも使えます。

モデル ストリーム有効 ストリーム無効
gpt-5 ×
gpt-5-mini ×
gpt-5-nano
gpt-5-chat-latest(非推論モデル)

Verify Organization(組織認証) とは

OpenAIが導入している組織認証は、主に次の目的で行われます。

  • 不正利用の防止
  • 利用ポリシーの順守
  • 高負荷機能(例: ストリーミング)の制限

認証には個人情報の提供が必要で、心理的ハードルを感じる人も少なくないでしょう。
もちろん、認証してしまえば全機能を使えるのですが、私はまだ様子見中です。

gpt-5 と gpt-5-chat-latest について

先ほど軽く触れましたが、gpt-5-chat-latestgpt-5 の非推論バージョンのモデルです。それぞれの特徴は次の通りです。

  • gpt-5(推論モデル)

    • 応答生成の前に、内部でより多くの「思考トークン」を使って推論する
    • 複雑な問題の精度が高い
    • その分、応答開始までの時間が長くなる
    • 利用するにはVerify Organization組織認証)が必須
  • gpt-5-chat-latest(非推論モデル)

    • 推論ステップを簡略化して、直接的に答えを生成する
    • 応答が速く、ストリーミングも早く始まる
    • 複雑な論理や長期計算では間違いやすい
    • Verify Organization組織認証)なしでも利用可能

1Mトークンあたりの利用価格はどちらも同じです(下表参照)。

MODEL INPUT CACHED INPUT OUTPUT
gpt-5 $1.25 $0.125 $10.00
gpt-5-chat-latest $1.25 $0.125 $10.00
gpt-4.1(参考) $2.00 $0.50 $8.00
gpt-4o(参考) $2.50 $1.25 $10.00

価格の面から想像すると、gpt-5-chat-latest は推論しないだけで、素の賢さgpt-5と同じだと思われます。また、推論しない分、gpt-5-chat-latest はコスト面でも有利だと思われます。

各モデルの特徴についてはOpenAIの公式発表資料をご参照ください。
https://openai.com/ja-JP/index/introducing-gpt-5-for-developers/

まとめ

  • GPT-5 / GPT-5-mini はストリーミング利用に組織認証必須
  • gpt-5-nano は例外で、認証なしでもストリーミング可能
  • 非推論でいいなら、gpt-5-chat-latest は認証なしでストリーミング可能
  • 認証を避けるなら「nano」または「ストリーミング無効」で利用

結論: 推論有効かつストリーミングを本格利用したいなら Verify Organizationを済ませるのが確実 です。推論が不要なら gpt-5-chat-latest が有力な選択肢になります。

開発目的や運用要件に合わせて、最適な選択をしてください。

それでは今回はこの辺で。
じゃあね、バイバイ😊

Discussion