📑
【Azure】Azure AI Content Understandingのコンテンツ抽出で遊んでみる
執筆日
2024/11/30
Azure AI Content Understanding
Microsoft Ignite 2024で発表されたサービスです。
ドキュメント、画像、動画、音声などのコンテンツをユーザー定義の出力形式に変換します。
→マルチモーダルのStructured outputs
リソースについて
2024/11/30時点では、WestUS、Sweden Central、Australia East の3リージョンのみ対応しています。
このリージョンで、Azure AI Servicesの構築をお願いします。
環境構築
- Azure AI Serviceを構築し、プロジェクトを作成する
※WestUS、Sweden Central、Australia East でリージョンで構築する
- 「管理センター」をクリックする
- Connected resourceをクリックする
- 「+新しい接続」をクリックする
- Azure AI サービスをクリックする
- 先ほど構築したAzure AI サービスをクリックし、接続をする
- 以下のURLをクリックする
https://ai.azure.com/explore/aiservices/vision/contentunderstanding - 「Create new Content Understanding project」をクリックする
※「Role Based Access Control Administrator」の権限が必要
コンテンツ抽出をする
- 「Define schema」をクリックする
- 「+Add new filed」をクリックする
- 抽出したい項目を定義し、「Save」をクリックする
- 「Test analyzer」をクリックする
- 以下の2つでテストする
↓1つ目
↓2つ目
- ファイルを上げて「Run analysis」をクリックする
- 結果、ちゃんと取れてる。
APIとして使えるようにする
- 「Build analyzer」をクリックする
- 「+Build analyzer」をクリックする
- Nameを入力し、「Build」をクリックする
- 作成されたことを確認
- 以下のDocsのように、RestAPIを実行する
まとめ
フォーマットに依存せずに、項目の抽出ができるのは本当にすごい。
→マルチモーダルのStructured outputsのイメージ。
Indexを作成する際のパイプラインとしても使えそう。
早くGAされないかなー。あと料金がどれぐらいなのかなー。
Discussion