🎉

【速報】Microsoft Build 2024 アップデート情報 Azure OpenAI関連

2024/05/22に公開

5月21-24日開催のMicrosoft Build から Azure OpenAI 関連のアナウンスをピックアップして紹介いたします。

Book of News全体の概要がございます。
Blog投稿

Azure OpenAI Serviceのアップデート

提供開始

  • GPT-4o(“o” for “omni)のグローバル展開とAPI提供開始

    • 提供リージョン:eastus,eastus2 , northcentralus, southcentralus, westus, westus3
    • トークン数: 最大 128k
    • Training Data: 2023年10月
    • 価格(100万トークン):Input: $5/ Output: $15
    • クォータと制限:オーディオは近日追加予定
    • デプロイの種類:
      • グローバル標準(Global-Standard):トラフィックが世界中に分散される。クォータ制限が高い
      • 標準(Standard):従来通りデプロイしたリージョンで処理される。クォータ制限が低い
      • GPT-4oの使用方法はこちらに記載しています。
  • gpt-4o グローバル標準

Tier Quota Limit in tokens per minute (TPM) Requests per minute
Enterprise agreement 10 M 60 K
Default 450 K 2.7 K
  • gpt-4o 標準
Tier Quota Limit in tokens per minute (TPM) Requests per minute
Enterprise agreement 1 M 6 K
Default 150 K 900
  • Assistants APIの機能追加

    • 従来から利用可能だったAssistants APIに以下の機能が追加され、複数のツール、ライブラリを組み合わせなくても単体で利用できることが増えてます。
      • ファイル検索:データソースからファイルをアップロードすると自動的に解析、チャンク化、埋め込みが行われ、検索の準備が整います。簡単なRAGの仕組みを作成する際に有用です。On your Dataで作成したIndexも追加できるようになる予定です。(7月)
      • Webページの内容を検索して回答できるようになる予定です。(7月)
      • アシスタント出力の制御とコストの管理: ユーザーは、スレッド、メッセージ、および実行で使用される入力トークンと出力トークンを表示し、アシスタント API で実行が使用するトークンの最大数を制御し、各実行で使用される以前のメッセージ数に制限を設定できます
      • GPT-4o のサポート
      • ビジョン サポート:画像の URL またはアップロードされたファイルを使用してメッセージを作成できます。
      • リージョン別の提供状況の拡大 (パブリック プレビュー): アシスタントのリージョンも拡張され、東日本、英国南部、インド南部、米国西部、米国西部が含まれるようになりました。
      • ストリーミングとポーリングのサポート (パブリック プレビュー): アシスタントを使用してアプリケーションで認識される待機時間を短縮するためのストリーミング応答のサポートが発表されました。Python SDK を使用すると、「作成とストリーミング」ヘルパーを使用して、実行を作成し、応答をシームレスにストリーミングできます。また、ポーリングを必要とせずにオブジェクトのステータス更新を共有できる SDK ヘルパーも追加されました。
      • Logic Apps を活用して、関数呼び出しでアシスタントを構築(5月末公開予定): コードを記述することなく、Azure OpenAI Studio の Azure OpenAI Assistants プレイグラウンドから Azure Logic Apps ワークフローを検出、インポート、呼び出しできるようになりました。
  • GPT-4のFine Tuningの提供開始

  • Batch API

    • OpenAI社ではすでに提供されていたBatch APIがAzure OpenAI Serviceでも提供されることになりました。(プレビュー)
    • Batch APIは、大量のテキストデータを一度に処理するためのAPIです。これにより、大規模なデータセットを処理する際に、より効率的に処理を行うことができます。主な特徴は以下になります。
      • トークンあたりの料金が通常より50%安い。
      • レートリミットの向上
      • 処理は最大24時間かかる場合があります。通常はこれより早く完了することが多いです。

Phi-3 ファミリーのアップデート

Models-as-a-Serviceでの提供開始

  • Phi-3-mini
    • 特徴:
      1. Phi-3-miniは、38億パラメーターを持つ小型の大規模言語モデル(SLM)です。
      2. このモデルは、性能面でより大きなモデルに匹敵し、特にエッジデバイスやIoTデバイスでの使用を念頭に設計されています。
      3. 高品質なデータセットを使用してトレーニングされ、効率的かつ高性能な推論を実現しています。
      4. Phi-3-miniは、セキュリティおよびプライバシーを重視した設計で、オフラインでも動作するため、低遅延かつプライバシーを保護します。

新しいPhiモデルのリリース

  • Phi-3-small: 70億パラメーター
  • Phi-3-medium: 140億パラメーター
  • Phi-3-Vision: 42億パラメーター
    • Phi-3-Visionの特徴:
      • 視覚的推論タスクだけでなく、チャート、グラフ、表の推論もサポート
      • 画像とテキストを入力し、テキスト応答を出力する機能

小さくても強力: 小規模言語モデル Phi-3 の大きな可能性


Models-as-a-Serviceに新しいモデルの追加

新しく追加されたモデル

  1. Core42 JAIS
  • 特徴: Core42 JAISは、アラビア語と英語のバイリンガル大規模言語モデルで、アラビア語の処理に特化しています。他のモデルと比べて、アラビア語の知識と推論能力で優れた成果を示し、文化的および言語的なニュアンスを理解するために設計されています。また、複数のアダプタを用いて特定のタスクや業界に対応する柔軟なチューニングが可能です
    https://core42.ai/jais.html
  1. Nixtla TimeGEN-1
  • 特徴: Nixtla TimeGEN-1は、時系列データの予測に特化した大規模言語モデルです。他のモデルと比べて、特に時系列データの精度の高い予測と分析に優れており、小売、電力、金融、IoTなど、さまざまなドメインに適応できます。
    Nixtla
    参照先:https://qiita.com/Matsuy_org/items/32825a41550182338ea1

近日追加予定のモデル

  1. Bria AI
  • 特徴: ビジュアル生成AIのソリューションを提供するプラットフォームです。商業利用に安全な視覚的生成AIモデルを提供し、法的にライセンスされたデータを使用して訓練されています。他のモデルと比べて、視覚的な創作に特化し、法的およびプライバシーコンプライアンスを重視しています
    https://bria.ai/
    参照先:https://romptn.com/tool/2471
  1. Gretel
  • 特徴: 人工データセットを生成するプラットフォームです。プライバシーを損なうことなくAIモデルの開発とテストを行うことができます。他のモデルと比べて、データセキュリティとコンプライアンスに焦点を当てた人工データ生成に特化しています
    https://gretel.ai/
  1. NTT DATA
  • 特徴: "tsuzumi"は日本語処理に強く、軽量でエネルギー効率に優れたモデルです。他のモデルと比べて、特定の業界やタスクに対する柔軟なチューニングが可能で、マルチモーダル(言語+視覚+聴覚)に対応しています​
    https://group.ntt/jp/magazine/blog/tsuzumi20240325/
  1. Stability AI
  • 特徴: オープンソースのAIモデルで、特にテキストから画像を生成する技術に強みがあります。他のモデルと比べて、アクセスの民主化を目指し、広く利用可能な最先端技術を提供しています​
    https://ja.stability.ai/
  1. AI21
  • 特徴: イスラエルのAI企業が"Jurassic"シリーズ等高度な言語モデルを開発し、高性能な自然言語理解(NLP)および生成タスクに対応しています。他のモデルと比べて、自然言語処理の精度とスケーラビリティに優れています.多言語対応:Jurassic-2は、スペイン語、フランス語、ドイツ語、ポルトガル語、多くの言語をサポートしています
    https://www.ai21.com/
  1. Cohere Rerank

Azure AI Searchの機能追加

プレビュー開始

  • バイナリベクトルタイプやその他のベクトル検索機能をサポートしました。Azure AI Search で Cohere Embed V3 などのバイナリ出力をサポートする埋め込みを格納して処理できるようになりました。高速化しながら、より大きなベクターデータセットを低コストで作成できます。
  • Microsoft Fabric 内のデータを Azure AI Search に直接接続
  • Azure AI Visionを活用した画像のベクトル検索:ユーザーが画像とテキストで検索出来るようになりました。
  • ベクトル重み付け、検索スコアのしきい値制御(関連が低いドキュメントを除外する)
  • ストレージ容量が大幅に増加し、追加コストなしでベクター インデックス サイズが最大 12 倍に増加し、RAG ワークロードを大規模に実行できるようになりました。
  • ハイブリッド検索における最大テキストリコールサイズ機能。キーワード検索再現率セットからハイブリッド検索クエリで呼び出すドキュメントの最大数を指定する機能を使用して、ハイブリッド検索エクスペリエンスを調整します 。また、'count' プロパティを調整して、一致するすべてのドキュメントを含めるか、定義されたウィンドウ内で取得したドキュメントのみを含めることもできます。取得するドキュメントの数を制御できるようになります。さらに、取得するテキストドキュメントの数を減らすと、パフォーマンスが大幅に向上します。

Azure AI Studioのアップデート

Generally Available(一般提供)

  • 発表来プレビューだった各種機能(プロンプトフロー、ハブと接続、モデルカタログとベンチマーク)
  • Models as a Service
    • カタログからすぐにLlama等のモデルを利用可能
  • AOAIモデルのファインチューニング
  • GPT-4 Turbo with Visionを使用したマルチモーダリティ

プレビュー開始

  • プロンプトフローのトレースとデバッグにより、ワークフローに関する開発者の分析情報が強化され、デバッグ プロセスが容易になります。
  • AZD(Azure Developer CLI)と通常のCLIにAI機能を追加
  • モニタリングと観測を使用することで組織は本番環境における主要なトークンの使用状況、品質、運用指標を監視できるようになります。ユーザーは傾向を視覚化し、タイムリーなアラートを受信して、継続的な改善を通知できます

その他発表

  • AOAI、Search、Speech、Content Safety、Vision、およびLanguageの統合
  • VS CodeとAI Toolkitとの統合AI Toolkit for Visual Studio
    • 開発者がモデルを取得して実行し、ローカルで微調整し、Azure AI Studio にデプロイするためのツールキットです。
  • AIアルゴリズムを保護するHidden Layersとのパートナーシップ
    • モデルをスキャンして、モデルをデプロイする前に、モデルに悪意のあるコードや改ざんの兆候がないことを確認できるようにします。
  • Windows Hello for Business で 10 年近く使用されてきた Azure AI Vision Face API の機能である Facial Liveness が、ブラウザーでプレビュー利用できるようになりました。
    • 顔のライブネス:Detect liveness in facesは、多要素認証(MFA)の重要な要素であり、たとえば、誰かが顔をカメラにかざして顔認識システムを妨害するなど、なりすまし攻撃を防ぎます。

Azure AI Content Safety

プレビュー開始

  • カスタムカテゴリ
    • 従来のカテゴリ(ヘイトと公平性、性的、暴力、自傷行為)に加え、カスタムカテゴリを追加することが可能になります
    • これにより独自のコンテンツをフィルターすることが可能になります。
  • プロンプトシールド
    • ユーザープロンプト攻撃とドキュメント攻撃を検出するための機能。これは、LLMから未承認の動作を引き出すためにシステムの脆弱性を悪用する攻撃を対象としています
      プロンプトシールド
  • Groundedness detection:根拠性検出

Discussion