📑

Tech Talk: LLM-Powered Alexa Experiences Previewの感想

2023/11/03に公開

生成AIとAlexa

生成AIを使ったAlexaスキルが近く作れるようになるとの動画です。
https://www.youtube.com/watch?v=EQkE2b-IODQ&t=8s

関連記事

2023年9月の記事です。
New developer tools to build LLM-powered experiences with Alexa

LLMを活用したAlexaエクスペリエンスを作成するための新しい開発者ツール

視聴メモ

YouTubeの自動翻訳を見て気になった事、大事だなと感じたことをまとめます。

翻訳、返事が毎回異なる事、LLMが意見を持つことは楽しいと思います。
会話型AI

生成AIと大規模言語モデルが実際にAlexaに何をもたらすのかについて少し話してもらえますか。
→自然な方法でリクエストを実現できるという事実は、アシスタントと長時間にわたる会話を可能にします。

パーソナライゼーションとコンテキスト
信頼の側面を真剣に扱っている
ビジュアルIDの役割を選択したお客様は、画面に向かうだけでAlexaとの会話を開始できます。
まったく新しい会話型音声認識エンジンを構築しました。
ジェネレーティブAIを活用したAlexaの新しいバージョンに私たちを導くでしょう。

開発者はコンテンツAPIをAlexaのLLMと統合して、会話エクスペリエンスを作成できるようになります。

キャラクターAIと連携
旅行プランナー

スマートホーム

Webサイト、製品マニュアル、PDFなどの非構造化データを使用して、コードなしのソリューションでコンテンツ主導のエクスペリエンスを構築できるようになりました。

APIを使用して、顧客とコンテンツを共有
開発者はAPIとAPIエンドポイントの説明だけをAPI定義に提供することで、Alexa LLMと統合できます。

顧客がデバイスに話している内容に基づいて、開発者がテキストを受信できるようにするASRテキスト
音声エクスペリエンスを最適化するためのプロンプトテンプレートなどを含むSDKの拡張機能を有効にする時期です。

APL応答とライブラリを有効にすることで、メディア再生、通知、リッチテキスト読み上げ、
アニメーションなどのデバイス機能を最大限に活用できます

テストできるツールを提供します

すべてのユーザーが利用できるようになる前に、LLMとサービスのパフォーマンスがどのようになるのか、
Alexa向けの開発がはるかに簡単になるだけではなく、はるかに強力になるようです。

Alexaスキルを10か国語にローカライズするのは単純なスキルでも大変だ
あの人気の家具チェーンのユーザーマニュアルを想像してみてください。

ブラウザで答えを得るまでに数分かかりますが、Alexaや音声インターフェースではそれが出来ません。
答えはほぼ数秒以内に返ってくると期待されています。

スローローリングしている理由の一つ
Amazonには素晴らしいツール Bedrockがあります。

とにかくやってみてください。
生成AIに詳しい場合、あなたはそれだけでBeyondに到達したのです。

感想

Alexa-hostedスキルのように、Amazon Kendraなどのアマゾンの生成AIサービスがAlexa向けにカスタマイズされて提供されるのではないか、と思いました。

https://twitter.com/allforbigfire/status/1704557989418647584

Alexa LLMが、Amazon Bedrockで未だに使用可能にならないAmazon純正の生成AIであるAmazon Titan FMと同一なのか否かなど、疑問が何一つ解決されない動画でした。
デベロッパーコンソールに新機能が追加されるなど、具体的な技術的な話はなかったと私は思いました。

11月27日より開催されるAWS re:Invent 2023まで何も出ないのかもしれない。
現時点で利用できる生成AIを組み合わせて、自分でAlexaに統合してスキルを作っていく方が、待ち時間がなくて良いと感じました。

Discussion