Open3

HippoRAGを試す

kun432kun432

https://twitter.com/bernaaaljg/status/1795260855002583101

📣 📣 私の博士課程で最もエキサイティングなプロジェクトを発表できることを誇りに思う: 「HippoRAG: Neurobiologically Inspired Long-Term Memory for Large Language Models」 だ。

HippoRAGは、タイトルが示すように、脳に着想を得たRAGフレームワークであり、LLMが外部文書にまたがる知識を効果的かつ効率的に統合することを可能にする。

🧠神経生物学的インスピレーション: HippoRAGのデザインは、ヒトの長期記憶に関する海馬インデックス理論に密接にインスパイアされている。海馬は脳の図書館員として描かれており、記憶インデックス関連付けを常に構築し、想起の向上を図っている。

💪 強力なパフォーマンス : 我々の手法は、いくつかのマルチホップQAベンチマーク(MuSiQue/2Wiki)において、最大20% という驚異的なマージンをもって、最先端のリトリーバーを凌駕している。

🚀 より速く、より安く: HippoRAGは反復RAG法(IRCoT)に匹敵する性能を得ながら、10-30倍速く6-13倍安い

🕵️‍♂️ パスファインディング型マルチホップ質問: 最後に、我々の手法により、既存のRAG手法では対応できない新しいシナリオに対応できることを示す。

論文

https://arxiv.org/abs/2405.14831

レポジトリ

https://github.com/OSU-NLP-Group/HippoRAG

kun432kun432

ツイートのスレ

https://twitter.com/bernaaaljg/status/1795260859423318175

ColBERTv2やContriever @gizacardのようなリトリーバーは、現在のRAG手法の堅牢な部分である。しかし、外部文書にまたがって知識を統合するタスクを達成するためには、RAGメソッドは依然として、IRCoT @harsh3vedi や DSPy @lateinteraction のような強力なLLMパイプラインに依存しなければならない。

対照的に、私たちの脳はこれらのタスクを即座に実行できることが多い。例えば、2024年の新人王を獲得したNBAチームの最終順位を見つけるには、GPT-4でさえ反復検索が必要だ。

https://twitter.com/bernaaaljg/status/1795260861499560135

これらの印象的な知識統合能力は、小さなC字型の脳構造である海馬に格納された連想に基づくインデックスに依存していると考えられている。

この理論にインスパイアされたHippoRAGは、強力なLLMが外部文書間で独自の連想インデックスを構築し活用することを可能にし、IRCoTと同等かそれ以上のシングルステップ・マルチホップ検索を、ほぼ1桁安いコストで高速に実現する。

https://twitter.com/bernaaaljg/status/1795260865035301091

もう少し深く掘り下げると、我々のデザインは、海馬インデックス理論で提唱されている2つの主要なプロセス、すなわち、知覚入力を区別するのに役立つパターン分離(PS)と、部分的な手がかりから完全な記憶を検索できるようにするパターン補完(PC)にインスパイアされている。

オフライン索引付けでは、LLMを使ってスキーマのないKG(我々の人工海馬索引)を外部文書から抽出し、文書を概念的かつ関係的なレベルで表現することで、新皮質のPSをモデル化する。

オンライン検索では、Personalized PageRankアルゴリズムを活用することで、海馬のPCをモデル化し、特定のクエリベースの制約に従いながらKGを効率的に探索することを可能にする。

https://twitter.com/bernaaaljg/status/1795260867979747689

これまで、私はHippoRAGをLLMパイプラインに代わる、より効率的なものとして説明してきたが、HippoRAGはまた、既存の手法ではまだ手の届かない重要な知識統合シナリオに取り組むことができるユニークな位置にあることに注目したい。

標準的なマルチホップ質問では、特定の推論パスをたどるが、パスファインディング・マルチホップ質問では、最初は同じように関連するように見える多くのパスの中から1つのパスを見つける必要がある。

下の図と表では、完璧なLLM推論者でさえ同じことをするのに苦労する中で、我々の方法がいかにこれらの質問に答えられるかを示している。

kun432kun432

Claudeにきいてみた

1. どんなもの?

  • 大規模言語モデル(LLM)のための長期記憶を実現するシステム「HippoRAG」を提案
  • 人間の海馬の長期記憶メカニズムに着想を得た、知識グラフ(KG)とPersonalized PageRankアルゴリズムを利用した新しい検索フレームワーク
  • 多段階の情報統合を単一の検索プロセスで実現することで、従来の検索手法を大幅に上回るパフォーマンスを示す

2. 先行研究と比べてどこがすごい?

  • 現行の検索拡張型生成(RAG)手法は、個々の文書を独立に扱うため、複数の文書間の情報統合が困難
  • HippoRAGは単一の検索プロセスでマルチホップ推論を実現し、MuSiQueやWikiMultiHopQAなどの難易度の高いマルチホップ質問応答タスクで大幅な性能向上を実現

3. 技術や手法の肝はどこ?

  • 人間の海馬の記憶メカニズムを模倣:
    • 大脳新皮質(ネオコルテックス)に相当するニューラルネットワーク
    • 海馬(カリフォルニア海馬)に相当する知識グラフ
    • 海馬傍回(パラヒポカンパス領域)に相当する検索エンコーダ
  • ニューラル情報処理によって知識グラフを構築し、PersonalizedPageRankアルゴリズムを用いて関連概念を統合的に検索

4. どうやって有効だと検証した?

  • 多数の質問応答ベンチマークで、単一検索とマルチステップ検索の両方で大幅な性能向上を実証
  • 特に、完全な情報統合が求められる「パスファインディング」型マルチホップ質問で顕著な改善を示した

5. 議論はある?

  • 単一の概念抽出に偏重しており、文脈情報の活用が不十分
  • 大規模な知識グラフ構築・維持のスケーラビリティが課題

6. 次に読むべき論文は?

そもそも脳の各部分の役割についても

一般的な脳の各部位の役割について、より分かりやすく説明いたします。

  • 大脳新皮質 (ネオコルテックス): 感覚入力の処理や高度な認知機能を担う。視覚、聴覚、運動、言語、記憶、注意力など、私たちの日常的な知的活動の中心的な役割を果たしている。
  • 海馬(カリフォルニア海馬): エピソード記憶の形成と保管に重要な役割を果たす。新しい経験を記憶し、既存の知識と関連付けることで、状況に応じた適切な行動を取れるようにする。
  • 海馬傍回 (パラヒポカンパス領域): 大脳新皮質と海馬の間をつなぐ経路として機能し、両者の情報統合を担当する。新しい情報を既存の記憶と関連付けたり、記憶の検索を行ったりする際に重要な役割を果たす。

つまり、大脳新皮質が知覚と認知の中心地、海馬が記憶の形成と保管を担当し、海馬傍回がそれらの間を仲介して情報の統合と検索を可能にしているのが、一般的な脳の機能分担といえます。