Open5

Azure AI Searchで調べたことまとめスクラップ

Kusuda DaisukeKusuda Daisuke

Private endpoint設定
Azure AI Searchのprivate endpoint設定では、ターゲットリソースを選択する必要があるため
ターゲットサブリソースをsearchSearviceにして対象のai searchのリソースを選ぶ
(private endpointはFreeは設定不可能、Basic以上)
他の設定は他リソースと一緒
https://learn.microsoft.com/ja-jp/azure/search/service-create-private-endpoint#portal-access-private-search-service

Kusuda DaisukeKusuda Daisuke

PDF TYPE3など文字が埋め込まれていたり画像であるPDFの対処方法(OCR)
問題:TYPE3フォントのPDFだと文字が読み込めない(文字化けする)
対処方法:PDFの内容をすべて画像として埋め込んだ新しいPDFを作成する
   画像ならAI VISIONのOCRとして文字を起こすことができる
   ただし、AI VISIONの金額が発生する(160円くらい / 1k トランザクション = PDF 1000枚)

参考:(defaultLanguageCodeをjaにする必要がある)
https://qiita.com/Yosuke_Sakaue/items/6c9fd940b868edd3cb96
https://learn.microsoft.com/ja-jp/azure/search/cognitive-search-skill-ocr

Kusuda DaisukeKusuda Daisuke

AI SearchにAzure Blobのメタデータを入れる

skillsetにBlobに入れたメタデータをIndexに割り当てる例
(Indexにあらかじめフィールドをそれぞれ設定する必要がある)

日本語のメタデータの注意:

Blobのメタデータには日本語は入らないため, URIエンコードなど別形にして保存する必要がある