🧚

Alibaba IMSで音声対話できるAIエージェントを試してみた

に公開

Alibaba Intelligent Media ServicesのAIエージェントで音声対話できるのが出たらしい ので試してみる〜

https://www.alibabacloud.com/help/ja/ims/user-guide/creating-and-managing-intelligences?spm=a2c63.p38356.help-menu-193643.d_2_8_4.414d3691wqH6qN

まずはIMSにアクセス

シンガポールリージョン固定なんだね〜

アクティベートと権限付与して使う!

![image.png]

Real-time ConversationsのIntelligent Agent Managementでやるらしい

Agentつくってみる

AgentはWorkflowに沿って動くのか〜

デフォルトでVoiceChatSystemWorkflowが用意されてたのでこれを設定する

ちなみにVoiceChatSystemWorkflowの中身をみてみると

基本的な流れのやつだ〜

ARTC Applicationってなんだろ?とおもったけどApsaraVideo Liveというのがあるのね

これもデフォルトのを設定しとく

Greetingをオンにして文言設定しておいてみる

作成!

できた〜

コールバックも設定できるみたい 今回はしない!


一覧に戻って、QR Code for Demoで試してみる

ここに載ってるQRコードからアプリいれて試す〜

日本語で挨拶したら中国語で返ってきたので、workflowを変えてみる〜

新規でworkflowを作って、Speech-to-textとLLMとText-to-speechをそれぞれ日本語にしてみた




Agentのほうで作ったworkflowを参照するようにしてsubmitする

アプリからもっかいつかってみる〜

おお〜できた!

全部日本語でやりとりできる〜!

まとめ

  • 音声対話出来るの楽でよい
  • Agentつくるのも、workflowつくるのもめっちゃ簡単でよい!
  • 音声認識についてはもうちょっと正確だと使いやすいかも
  • あとやっぱり日本語のやりとりに途中で中国語入ってきたりもするからモデルのアップデートに期待

おわり

Discussion