🌟
デジタルヒューマン:Azure AIのアバターとは何か?
Microsoft Ignite 2023でテキスト読み上げてくれるアバターとライブチャットするアバターが発表されましたのでどのようなものか簡単にまとめてみました。
概要
- カスタムニューラル音声と組み合わせることで独自の音声を使用し、アバターの音声を自分に変換可能
- 作成したアバターのビデオは出力可能で他のアプリケーションに応用
- ビデオの途中にジャスチャを挿入しよりリアルな会話を可能に
- テキストを用意することでバッチ的にビデオを作成
- リアルタイムでアバターと会話
- アップロードされたビデオから独自のアバターを作成
詳細の使い方
アクセス
-
Speech Studio からアクセスします。
- サインアップやコーディングなしにすぐ使用可能
- 2023年11月時点でサポートされているリージョンは以下のみ
- 米国西部 2、西ヨーロッパ、東南アジア
- Speech Studio - 会話アバター (microsoft.com) から入力した文字を読み上げるアバターを編集することが可能です。
アバターと背景の変更
言語と音声
- 様々な言語と用意された音声を選択できます
ジェスチャーも挿入可能
- 会話中にジェスチャーを挿入することが可能です
アウトプット
- ビデオを生成する場合は「プレビュービデオ」を選択すればビデオが作成されます
- 従来のビデオ作製ツールより高速に作成されます
他にはライブチャット機能等もあります
考えられるユースケース
-
カスタマーサポートとヘルプデスク:
アバターは、カスタマーサービスの分野で、質問に回答したり、情報を提供したりするために使用できます。これにより、待ち時間の短縮や24時間対応などが実現可能になります。 -
販売とマーケティング:
製品やサービスのプレゼンテーション、販売促進活動、パーソナライズされたマーケティングメッセージの配信にAIアバターを利用できます。 -
トレーニングと教育:
従業員の研修や顧客向けの製品説明会など、教育的なコンテンツを提供する際に、AIアバターが活用できます。 -
エンターテイメントとメディア:
映画、テレビ、ゲーム業界でのキャラクター作成や、バーチャルリアリティと拡張現実体験の開発にもAIアバターが使用できます。 -
アクセシビリティの向上:
音声認識やテキスト読み上げ機能を備えたAIアバターは、視覚障害者や覚障害者など、特定のニーズを持つユーザーに対するアクセシビリティの向上に貢献出来ると思います。
金額
- 2023年11月時点での金額は以下の通りです。
- 価格のページからだと1M characters(100万文字)毎に約2,300円だと思います。
-
Cognitive Speech Services Pricing
Discussion