Open5
Azure AI Searchで調べたことまとめスクラップ

Open AIとAzure AI Searchとのプライベート接続
=> 共有プライベートリンク経由
S2以上のプランがじゃないとできない
Azure Blob Storageとのプライベート接続も同様

Azure Blobへのファイル追加・削除のindexerの自動追尾
削除の追跡をオンにしたらBlobに追加・削除した場合に、インデクサーを実行したらそのファイルだけ更新してくれる

Private endpoint設定
Azure AI Searchのprivate endpoint設定では、ターゲットリソースを選択する必要があるため
ターゲットサブリソースをsearchSearviceにして対象のai searchのリソースを選ぶ
(private endpointはFreeは設定不可能、Basic以上)
他の設定は他リソースと一緒

PDF TYPE3など文字が埋め込まれていたり画像であるPDFの対処方法(OCR)
問題:TYPE3フォントのPDFだと文字が読み込めない(文字化けする)
対処方法:PDFの内容をすべて画像として埋め込んだ新しいPDFを作成する
画像ならAI VISIONのOCRとして文字を起こすことができる
ただし、AI VISIONの金額が発生する(160円くらい / 1k トランザクション = PDF 1000枚)
参考:(defaultLanguageCodeをjaにする必要がある)

AI SearchにAzure Blobのメタデータを入れる
skillsetにBlobに入れたメタデータをIndexに割り当てる例
(Indexにあらかじめフィールドをそれぞれ設定する必要がある)
日本語のメタデータの注意:
Blobのメタデータには日本語は入らないため, URIエンコードなど別形にして保存する必要がある