📝
Azure Open AI 調査
背景
- Azure上でデプロイするにあたっての不明点をまとめる。
デプロイのモデル
- デプロイのモデルは複数ある。
- スクショのように選択ができる。
デプロイで選択できるもの
デプロイの比較表
デプロイの種類 | 説明 | 用途 | コスト | レイテンシー | ユースケース |
---|---|---|---|---|---|
グローバル標準 | Azureのグローバルリージョンで利用できる標準的なデプロイ方法 | 一般的なアプリケーションやAPI利用 | 標準 | 低 | チャットボット、ドキュメント生成、FAQボット、リアルタイム翻訳 |
データゾーン標準 | 指定のデータゾーン(地域)に限定した標準デプロイ | 地域データ規制がある場合 | 標準 | 低 | データ主権が必要なサービス、金融・医療分野での利用 |
グローバルバッチ | バッチ処理向けに最適化されたデプロイ | 非同期処理や大量データの処理 | 低 | 高 | 企業のデータ分析、テキスト要約、ログ解析、大規模データの処理 |
データゾーンバッチ | データゾーンに限定したバッチ処理向けデプロイ | 地域制約があるバッチ処理 | 低 | 高 | 規制対応が必要なデータのバッチ処理(例:EU圏内でのデータ処理) |
グローバルプロビジョニング管理 | ユーザーが事前にプロビジョニングしたリソースを管理 | 高可用性が求められるサービス | 高 | 低 | 24/7のエンタープライズアプリ、SLA保証が必要なサービス |
データゾーンプロビジョニング管理 | データゾーンに限定したプロビジョニング管理 | 地域制約があるが、高可用性が必要なサービス | 高 | 低 | 金融機関や政府機関での高可用性が求められるシステム |
Provisioned-managed | 事前プロビジョニングされたリソースでスケール可能 | エンタープライズ向け | 高 | 低 | 大企業向けのAI基盤、パーソナライズされた検索エンジン、SaaSサービス |
- データをどこで処理するかとその対象でデプロイが異なる。
- データゾーン標準を選ぶと下記のような表示が出る。リージョンよりも大きな地域で閉じて処理されるものと理解。
East US での展開では、US データ ゾーン内のデータが処理されます
この展開で使用される AI リソースは East US にあるため、データ ゾーン標準 展開は US データ ゾーン内のデータを処理します。
- グローバルバッチ・データゾーンバッチとあるが、これは数百のPDFファイルの要約などを一括で実施するためのデプロイモデルだそう。
モデルについて
- 2025/3時点でoシリーズのモデルまでサポートしている。
下記のように4oに比較してトークン数が増えている。
Provisioned-managed
デプロイするモデルによってこれが選べる選べないがあると思われる。
gpt-4、4o 4o-miniだと出てくるが、
o1だと選択ができない。
どのモデルがどのリージョンでどのデプロイができるか
- 非常にややこしいため表形式となっている。MSのURLから読み取る必要がある。
具体的にはStandardを選ぶと、Japan eastでは4oは選べない、などがわかる。
Discussion