🤑

Azure OpenAI 東日本リージョン(Japan East)でGPTの標準デプロイのモデルが利用できなくなる?

2024/06/12に公開
2

2024年8月段階の情報をアップデートした記事を投稿しましたので、あわせてご確認ください。
https://zenn.dev/incudata/articles/azure-japane-openai-deploy

以下2024年6月段階の情報

気軽に使える標準デプロイのモデルが使えなくなりそうです。
この件について言及している記事が見当たりませんでした。
認識齟齬がありましたらご指摘いただけると幸いです。
(2024年6月12日現在の情報を元に執筆しています)

これから起きること

Azure OpenAIのモデルを特定のリージョンで標準デプロイを利用できなくなる可能性があります。

何が今(2024/6)は使えるの?

Azure東日本リージョン(Japan East)のGPTとしては次の3つのモデルが利用できます。[1]

  • GPT-4(vision-preview)
  • GPT-3.5-turbo(0613)
  • GPT-3.5-turbo-16k(0613)

これらのモデルの今後

2024年8月1日で利用できなくなる見込みです。[2]

GPT-4(vision-preview)

2024年6月10日以降にGPT-4のturbo-2024-04-09にアップグレードされます。
※ただし、東日本ではturbo-2024-04-09は提供されていないです。

GPT-3.5-turbo(0613)とGPT3.5-turbo-16k(0613)

2024年8月1日で終了します。

今後はどうする

次の2️つが考えられます。

  • 東日本リージョン(Japan East)を使いたければ「プロビジョニング済み」を利用する
  • 東日本以外のリージョンに移行する

デプロイの種類

Azure OpenAIにはデプロイと呼ばれるホスティング構造を選択できます。[3]
次の3つの種類があります。

  • グローバル標準(動的リージョン)
  • 標準(リージョン指定)
  • プロビジョニング済み(リージョン指定)

グローバル標準

GPT-4oのみが提供されており、リージョンは動的にルーティングされます。[4]
Azureでない「生」のOpenAIに似た形の提供の仕方と思っています。

標準

東日本リージョンで利用可能です。
既に前項で記載していますが、東日本リージョンでの提供は次の通りです。

  • GPT-4(vision-preview)
    • 2024年6月10日以降turbo-2024-04-09へアップグレード
  • GPT-3.5-turbo(0613)
    • 2024年8月1日で終了
  • GPT-3.5-turbo-16k(0613)
    • 2024年8月1日で終了

GPT-4(vision-preview)はturbo-2024-04-09へアップグレードされるとのことですが、現時点で東日本リージョンでturbo-2024-04-09の提供は行われていません。ここに関しては公式ドキュメントの記載通りであればturbo-2024-04-09リリース後に閉鎖になると思われます。[5]

gpt-4 バージョン 1106-Preview、0125-Preview、vision-preview は、将来安定したバージョンの gpt-4 でアップグレードされる予定です。 "自動更新を既定にする" と "期限切れになったときにアップグレードする" に設定された gpt-4 バージョン 1106-Preview、0125-Preview、vision-preview のデプロイは、安定バージョンがリリースされた後にアップグレードが開始します。 デプロイごとに、API 呼び出しのサービスを中断せず、モデル バージョンのアップグレードが行われます。 アップグレードはリージョン別にステージングされ、完全なアップグレード プロセスには 2 週間かかると予想されます。 "自動更新なし" に設定された gpt-4 バージョン 1106-Preview、0125-Preview、vision-preview のデプロイはアップグレードされず、プレビュー バージョンがリージョンでアップグレードされると動作を停止します。 アップグレードのタイミングについては、Azure OpenAI モデルの提供終了と非推奨に関する記事を参照してください。

プロビジョニング済み

東日本リージョンで利用可能です。
プロビジョニング スループット ユニット (PTU) を指定して利用します。[6]

東日本リージョンでの提供は次の通りです。

  • GPT-4-1106-preview
    • 2024年6月10日以降turbo-2024-04-09へアップグレード
  • GPT-4-0125-preview
    • 2024年6月10日以降turbo-2024-04-09へアップグレード
  • GPT-4-turbo-2024-0409
  • GPT-4o-2024-0513
  • GPT-3.5-turbo-0125
    • 2025年2月22日で終了

まとめ

GPT-4oが東日本リージョンの標準デプロイで利用できればよいのですが。。
GPT-4ほど精度は必要なく、気軽な検証のためにGPT-3.5を利用していたので、路頭に迷っています。

  • 気軽な検証やリージョン指定が不要な場合はグローバル標準を活用する
  • 東日本リージョン(Japan East)を使いたければ「プロビジョニング済み」を利用する
  • (提供されれば)東日本リージョンでGPT-4-turbo-2024-0409を標準デプロイで利用する

参考

[1]標準デプロイで利用できるモデル

https://learn.microsoft.com/ja-jp/azure/ai-services/openai/concepts/models#standard-deployment-model-availability

[2]モデル廃止

https://learn.microsoft.com/ja-jp/azure/ai-services/openai/concepts/model-retirements

[3]デプロイのタイプ

https://learn.microsoft.com/ja-jp/azure/ai-services/openai/how-to/deployment-types

[4]グローバルとリージョンのデプロイの種類

https://learn.microsoft.com/ja-jp/azure/ai-services/openai/how-to/deployment-types#global-versus-regional-deployment-types

[5]GPT-4 モデルと GPT-4 Turbo モデル

https://learn.microsoft.com/ja-jp/azure/ai-services/openai/concepts/models#gpt-4-and-gpt-4-turbo-models

[6]プロビジョニングされたスループットとは

https://learn.microsoft.com/ja-jp/azure/ai-services/openai/concepts/provisioned-throughput

[7]プロビジョニング スループットにアクセスするにはどうすればよいですか?

https://learn.microsoft.com/ja-jp/azure/ai-services/openai/concepts/models#how-do-i-get-access-to-provisioned

Discussion

tutu

これってつまり、
 1. セキュリティ事情で日本リージョンしか使えない組織は、
 2. 今の従量課金モデルは停止するから、
 3. 引き続き日本リージョンで使いたかったら、
 4. MS社に電話して営業と打ち合わせて、見積もりをもらい、
 5. 月額固定費用を払わされながらも、上限に達したら停止。
という、ことぉ? 殿様商売って怖いですね

Satoshi TakayanagiSatoshi Takayanagi

コメントありがとうございます。
Microsoft社公式からアナウンスは現時点ではないですが、ユーザー影響が少ない解決策が出ればと思います。