🤖
OpenAi AssistantのFile searchでめちゃくちゃ詰まった話
何に詰まったの?
OpenAiのAssistantにはFile Searchという機能があり、VectorStoreにアップロードされているファイルを参照してそれを元に回答を生成するものです。
今回はその機能を用いてPDFから情報を得ようと頑張りました。
だが、全くうまくいかずinvalid_file
エラーに悩まされました。
The file could not be parsed
うまくいくファイルもいかないファイルも有り、めちゃくちゃ時間を使ったのでみなさんが同じことに悩まされないように備忘録として書いています。
結論
原因はPDFファイルが画像ベースであり、文字情報がないことでした。
これを回避するためにはOCRで読み取った文字をもとにやるしか有りません。
私はAzure Document Inteligenceを利用することにしました
参考にしたコミュニティ記事
Discussion