🌊

Azure OpenAIの「Add your data」で出来ること出来ないこと

に公開
3
GitHubで編集を提案
Microsoft (有志)

Discussion

たかじゅんたかじゅん

すみません、質問よろしいでしょうか。
Azure Open AIの「Add your data」は複数ファイルをアップロードしておいて、チャットした場合、全てのファイル内容を考慮した回答を得られるのでしょうか?
例えば、AAA.pdf、BBB.pdf、ccc.pdfをアップロードしておいて、これら3ファイル内の内容に関わる質問をチャットした場合、これら3ファイルの内容を考慮した回答をしてくれるのでしょうか?
(ネットで調べていたのですが、情報が見つからず質問させていただきました)

Junpei Tsuchida(07JP27)Junpei Tsuchida(07JP27)

はい、全てのファイルが検索対象になります。
Blobに対してファイルをアップロードする方式でAdd your dataを使用する場合でも最終的にはCogntiive Searchにインデックスが作成されアップロードしたデータ全てがインデックス内に格納されて検索対象になります。
インデックスに複数件ヒットする情報があれば複数件のデータが情報源として以下の画像のように引用として表示されます。(Azure OpenAI Studioで試行した場合)

ただし、際限なく情報源が取得されるかというとそうではなく、Add your dataからインデックスに対する検索時に最大で上位10件を取得するようなリクエストが飛んでいます(top=10の部分)。これはこちらの内容と同じく診断設定を有効化し、Add your dataからSearchへのクエリログを見ることで確認することができます。

ポイントを流れでまとめると

  • アップロードしたデータはファイルの数によらず1つのCognitive Searchインデックスとして検索対象になる。
  • チャットで聞いた内容からAIが検索文字を生成してadd your dataからSearchに投げられる。
  • Searchから上位10件までを情報として取得する。
  • 取得した上位の情報からAIが回答を生成する。

となります。参考になれば幸いです。