🤖

RAGで「AIエージェント」を使う手法まとめ

2025/01/31に公開
1
54

本記事では、RAGの性能を高めるための「Agentic RAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。

この記事は何

この記事は、「AIエージェント」をRAGに取り入れた手法である「Agentic RAG」のサーベイ論文[1]について、日本語で簡単にまとめたものです。
https://arxiv.org/abs/2501.09136

今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合はこちらの記事もご参考下さい。

本題

ざっくりサマリー

RAGで「AIエージェント」を使う手法の概要

Agentic RAG は、RAGの新しい手法です。この論文では、「RAGにAIエージェントを使っている」とはどういう状態なのか、どんなパターンがあるのかまとめられています。クリーブランド・ステート大学の研究者らによって、2025年1月に発表された論文です。

最近、「AIエージェント」が注目されています。(※こちらの記事でも2025年のトレンド予想として紹介しました)。Agentic RAG という手法は、要するに、「RAGシステムにも、人間のように仕事してほしい」という理想を実現するための手法です。

従来のRAGでは、「文献を1回しか検索できない」など柔軟性がなく、最終的な回答が不十分になってしまうという問題がありました。普通の人間だったらここで終わらず、情報が十分になるまで調べ続けるはずです。

そこで、「Agentic RAG」という手法では、RAGシステムの中でLLM自身が、①振り返り・②計画・③ツール利用・④複数エージェントでの協力を、できる仕組みにしています。

問題意識


従来のRAGでは、柔軟性がありませんでした。例えば、普通のRAGでは「セルフチェック」するような仕組みはありません。なので基本的には、検索した内容をそのまま回答するような仕組みになります。

ただ、2024年の論文で「LLMにセルフチェック(Reflection)させると、問題解決能力が向上する」という研究があります[2]。「でしょうね。」という感じですが、普通のRAGには、この柔軟性がありません。

セルフチェックは一例であり、RAGの柔軟性の問題は他にもあります。例えば「曖昧な質問」が来ても聞き返したりできなかったり[3]、「複数要素が絡む質問」で複数回の文書検索ができなかったり[4]

こうした問題を解決するための、個別の手法は、これまでも多くありました。しかし、「Agentic RAG」では、チマチマ手法を組み合わせず、もっと汎用的に解決できるようにしようとしています。

Agentic RAG の特徴

以下の4つの設計パターンがあります。

【設計パターン】

  1. Reflection(自己反省): 出力を評価し、自分で改善
  2. Planning(計画): 与えられたタスクを事前に細分化してから実行
  3. Tool Use(ツール利用): 外部APIやデータベースを活用
  4. Multi-Agent Collaboration(マルチエージェント協力): 複数のエージェントが協調

また、「Agentic RAG」の、ざっくり分類は以下です。

【既存のRAG、ざっくり分類】

  1. Naïve RAG: シンプルなRAG
  2. Advanced RAG: ハイブリットサーチやリランキングなどによる高度な検索
  3. Modular RAG: ツール利用可能にするなどさらに複雑化、コンポーネント化
    (注: 日本ではこれも含めてAdvanced RAGと呼ばれていた印象です)
  4. Graph RAG: グラフデータ構造を利用して検索・推論強化
  5. Agentic RAG: AIエージェントを利用

また、「Agentic RAG」を用いたRAGのアーキテクチャには、以下のような例があります。

【アーキテクチャ】

  1. シングルエージェント型
    • 1つのエージェント(LLM)が全部をこなす。
    • シンプルだが、精度が一番いいとは言えない。

  1. マルチエージェント型
    • 複数のエージェント(LLM)がデータソースごとに存在。
    • 最適なクエリで検索するなど、さらに柔軟 & 回答精度が高くなる

  1. 階層型エージェント
    • エージェントを階層化。
    • 上位エージェントが戦略決定し、下位エージェントが実行。

  1. Corrective RAG(セルフチェック付きRAG)

    • 検索結果が十分かどうかセルフチェック。
    • 以前紹介した「CRAG」よりも少し広い概念。「CRAG」が、ここに分類されるイメージ。
  2. Adaptive RAG(適応型RAG)

    • ユーザーの質問内容に応じて、戦略を使い分ける。
    • ※以前、こちらでも紹介しました。

  1. Graph-Based Agentic RAG
    • グラフDBとAIエージェントを利用したRAG。
    • Agent-GやGeARなど

まとめ

こうして見ると分かるように、「AIエージェント」自体は新しくありません。例えば「Baby AGI」は2023年からありますが、これはまさに「Agentic RAG」です。

とはいえ、2025年だからこそ、ここまで「AIエージェント」が盛り上がっている意味も、わかります。2024年後半には、ツール利用の精度が上がる「Structured Output」機能が登場したり、最高性能の「o1」モデルが「Reflection」を利用するなど、AIエージェントにとって追い風がありました。

実際、こうした追い風もあり、弊社が普段の業務でお話している大企業のお客様でも、「AIエージェントを使えば、こんなこともできるのではないか」と想像がつきやすくなりました。そこから、「AIエージェント」を使った素晴らしいユースケースが、いくつも発掘されてきています。

なので、「Agentic RAG」は、単なる流行というより、普通に実務で利用できる手法ですし、今後も盛り上がると考えています。

みなさまが業務でRAGシステムを構築する際も、選択肢として参考にしていただければ幸いです。今後も、RAGの回答精度を上げるような工夫や研究について、記事にしていこうと思います。我々が開発しているサービスはこちら

脚注
  1. "Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG", Singh et al. ↩︎

  2. "Self-Reflection in LLM Agents: Effects on Problem-Solving Performance", Renze et al. ↩︎

  3. この記事での「曖昧な質問に弱い」問題と同様。この記事では、「AIエージェント」ではない別の方法で解決しています。 ↩︎

  4. この記事での「複数要素が絡む質問に弱い」問題と同様。この記事では、「AIエージェント」ではない別の方法で解決していますが。 ↩︎

54
ナレッジセンス - AI知見共有ブログ

Discussion

a1134mta1134mt

これは、かつてfanctioncallingと呼ばれていたものとは別物なのでしょうか