Open4
RAG
LLMのエコシステム
Langflow
テキスト抽出不要のRAGを実現するColPali
課題
PDF -> 文字列化 -> エンべディングで精度がでない問題や、前処理のコストが大きい問題。
解決策
PDF -> 1024分割した画像 -> エンべディングすることにより、前処理のコストを削減。
さらに高精度なアウトプットが期待できたとのこと。
RAG fusion
課題
入力クエリが複雑な場合などに、ベクトル検索の精度が悪くなる。
方法
入力クエリをLLMにより分割し、複数の単純な質問に分解する。
分解した質問によって取得したクエリを用いてベクトル検索を複数回実施し、
得た結果をRerankを用いて評価し、スコアが上位のものをいくつか参照情報として与え、
それをLLMのインプット情報として与えて、回答を返却する手法