Azure OpenAI 東日本リージョン(Japan East)でGPTの標準デプロイのモデルが利用できなくなる?
2024年8月段階の情報をアップデートした記事を投稿しましたので、あわせてご確認ください。
以下2024年6月段階の情報
気軽に使える標準デプロイのモデルが使えなくなりそうです。
この件について言及している記事が見当たりませんでした。
認識齟齬がありましたらご指摘いただけると幸いです。
(2024年6月12日現在の情報を元に執筆しています)
これから起きること
Azure OpenAIのモデルを特定のリージョンで標準デプロイを利用できなくなる可能性があります。
何が今(2024/6)は使えるの?
Azure東日本リージョン(Japan East)のGPTとしては次の3つのモデルが利用できます。[1]
- GPT-4(vision-preview)
- GPT-3.5-turbo(0613)
- GPT-3.5-turbo-16k(0613)
これらのモデルの今後
2024年8月1日で利用できなくなる見込みです。[2]
GPT-4(vision-preview)
2024年6月10日以降にGPT-4のturbo-2024-04-09にアップグレードされます。
※ただし、東日本ではturbo-2024-04-09は提供されていないです。
GPT-3.5-turbo(0613)とGPT3.5-turbo-16k(0613)
2024年8月1日で終了します。
今後はどうする
次の2️つが考えられます。
- 東日本リージョン(Japan East)を使いたければ「プロビジョニング済み」を利用する
- 東日本以外のリージョンに移行する
デプロイの種類
Azure OpenAIにはデプロイと呼ばれるホスティング構造を選択できます。[3]
次の3つの種類があります。
- グローバル標準(動的リージョン)
- 標準(リージョン指定)
- プロビジョニング済み(リージョン指定)
グローバル標準
GPT-4oのみが提供されており、リージョンは動的にルーティングされます。[4]
Azureでない「生」のOpenAIに似た形の提供の仕方と思っています。
標準
東日本リージョンで利用可能です。
既に前項で記載していますが、東日本リージョンでの提供は次の通りです。
- GPT-4(vision-preview)
- 2024年6月10日以降turbo-2024-04-09へアップグレード
- GPT-3.5-turbo(0613)
- 2024年8月1日で終了
- GPT-3.5-turbo-16k(0613)
- 2024年8月1日で終了
GPT-4(vision-preview)はturbo-2024-04-09へアップグレードされるとのことですが、現時点で東日本リージョンでturbo-2024-04-09の提供は行われていません。ここに関しては公式ドキュメントの記載通りであればturbo-2024-04-09リリース後に閉鎖になると思われます。[5]
gpt-4 バージョン 1106-Preview、0125-Preview、vision-preview は、将来安定したバージョンの gpt-4 でアップグレードされる予定です。 "自動更新を既定にする" と "期限切れになったときにアップグレードする" に設定された gpt-4 バージョン 1106-Preview、0125-Preview、vision-preview のデプロイは、安定バージョンがリリースされた後にアップグレードが開始します。 デプロイごとに、API 呼び出しのサービスを中断せず、モデル バージョンのアップグレードが行われます。 アップグレードはリージョン別にステージングされ、完全なアップグレード プロセスには 2 週間かかると予想されます。 "自動更新なし" に設定された gpt-4 バージョン 1106-Preview、0125-Preview、vision-preview のデプロイはアップグレードされず、プレビュー バージョンがリージョンでアップグレードされると動作を停止します。 アップグレードのタイミングについては、Azure OpenAI モデルの提供終了と非推奨に関する記事を参照してください。
プロビジョニング済み
東日本リージョンで利用可能です。
プロビジョニング スループット ユニット (PTU) を指定して利用します。[6]
東日本リージョンでの提供は次の通りです。
- GPT-4-1106-preview
- 2024年6月10日以降turbo-2024-04-09へアップグレード
- GPT-4-0125-preview
- 2024年6月10日以降turbo-2024-04-09へアップグレード
- GPT-4-turbo-2024-0409
- GPT-4o-2024-0513
- GPT-3.5-turbo-0125
- 2025年2月22日で終了
まとめ
GPT-4oが東日本リージョンの標準デプロイで利用できればよいのですが。。
GPT-4ほど精度は必要なく、気軽な検証のためにGPT-3.5を利用していたので、路頭に迷っています。
- 気軽な検証やリージョン指定が不要な場合はグローバル標準を活用する
- 東日本リージョン(Japan East)を使いたければ「プロビジョニング済み」を利用する
- (提供されれば)東日本リージョンでGPT-4-turbo-2024-0409を標準デプロイで利用する
参考
[1]標準デプロイで利用できるモデル
[2]モデル廃止
[3]デプロイのタイプ
[4]グローバルとリージョンのデプロイの種類
[5]GPT-4 モデルと GPT-4 Turbo モデル
[6]プロビジョニングされたスループットとは
[7]プロビジョニング スループットにアクセスするにはどうすればよいですか?
Discussion
これってつまり、
1. セキュリティ事情で日本リージョンしか使えない組織は、
2. 今の従量課金モデルは停止するから、
3. 引き続き日本リージョンで使いたかったら、
4. MS社に電話して営業と打ち合わせて、見積もりをもらい、
5. 月額固定費用を払わされながらも、上限に達したら停止。
という、ことぉ? 殿様商売って怖いですね
コメントありがとうございます。
Microsoft社公式からアナウンスは現時点ではないですが、ユーザー影響が少ない解決策が出ればと思います。