Open4

RAG

gizumongizumon

テキスト抽出不要のRAGを実現するColPali

課題

PDF -> 文字列化 -> エンべディングで精度がでない問題や、前処理のコストが大きい問題。

解決策

PDF -> 1024分割した画像 -> エンべディングすることにより、前処理のコストを削減。
さらに高精度なアウトプットが期待できたとのこと。
https://zenn.dev/knowledgesense/articles/08cfc3de7464cb

gizumongizumon

RAG fusion

課題

入力クエリが複雑な場合などに、ベクトル検索の精度が悪くなる。

方法

入力クエリをLLMにより分割し、複数の単純な質問に分解する。
分解した質問によって取得したクエリを用いてベクトル検索を複数回実施し、
得た結果をRerankを用いて評価し、スコアが上位のものをいくつか参照情報として与え、
それをLLMのインプット情報として与えて、回答を返却する手法
https://zenn.dev/khisa/articles/ab79ad0a92a117