🐥

【Azure】-VoiceRAGのサンプルアプリを動かし方

2024/12/16に公開

執筆日

2024/12/16

やること

GPT-4o-Real-timeAudioを使ったVoiceRAGサンプルアプリをMicrosoftがGithubで公開をしています。そのアプリを使ってVoiceRAGを勉強しよと思ったのですが、立ち上げに苦労したので共有です。だれかの役に立てばなと。

https://github.com/Azure-Samples/aisearch-openai-rag-audio

ざっくり手順

  1. インフラ(Azure)の準備
  2. アプリを立ち上る

引っかかった点

  1. indexのセマンティック構成の名前をdefaultにする
  2. app/backend/.envを作成する
  3. DevContainerを立ち上げる

インフラ(Azure)の準備

  1. 以下のリソースが必要です
    Azure Open AI Service
  • East US2もしくはSweden Centralでデプロイ
  • GPT-4o Realtime Audioをデプロイ

https://zenn.dev/headwaters/articles/44d4152b85cac1

Azure AI Search
indexが作成済みであること
https://zenn.dev/horitaka/articles/azure-ai-search-blobstorage1

弊社の2023 年 12 月期通期決算説明会 質疑応答 をindexに登録する

https://www.headwaters.co.jp/images/20240305.pdf

アプリを立ち上る

  1. 以下のURLをクリックする

https://github.com/Azure-Samples/aisearch-openai-rag-audio

  1. Readmeに従って、DevContainerとVscodeを立ち上げる
  1. app/backend/.envを作成する
  2. .envに以下の接続情報を書く
AZURE_OPENAI_ENDPOINT= <AOAI エンドポイント>
AZURE_OPENAI_REALTIME_DEPLOYMENT= <GPT-4o Realtime Audio モデル名>
AZURE_OPENAI_REALTIME_VOICE_CHOICE=<choose one: echo, alloy, shimmer>
AZURE_OPENAI_API_KEY= <AOAI キー>
AZURE_SEARCH_ENDPOINT= <AI Search エンドポイント>
AZURE_SEARCH_INDEX= <index名>
AZURE_SEARCH_API_KEY=<AI Search キー>
  1. 以下のコマンドを実行する
./scripts/start.sh
  1. 立ち上がったことを確認する
  2. 話しかける

https://www.youtube.com/watch?v=5NWRuw6G8PU

まとめ

VoiceRAGを触ってみました。
コードはじっくり見ていないですが、Function_callingでうまーく実装しているとのこと。
奥が深そうだな。勉強しよ。
https://techcommunity.microsoft.com/blog/azure-ai-services-blog/voicerag-an-app-pattern-for-rag--voice-using-azure-ai-search-and-the-gpt-4o-real/4259116

ヘッドウォータース

Discussion