RAGで「AIエージェント」を使う手法まとめ
本記事では、RAGの性能を高めるための「Agentic RAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。
この記事は何
この記事は、「AIエージェント」をRAGに取り入れた手法である「Agentic RAG」のサーベイ論文[1]について、日本語で簡単にまとめたものです。
今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合はこちらの記事もご参考下さい。
本題
ざっくりサマリー
Agentic RAG は、RAGの新しい手法です。この論文では、「RAGにAIエージェントを使っている」とはどういう状態なのか、どんなパターンがあるのかまとめられています。クリーブランド・ステート大学の研究者らによって、2025年1月に発表された論文です。
最近、「AIエージェント」が注目されています。(※こちらの記事でも2025年のトレンド予想として紹介しました)。Agentic RAG という手法は、要するに、「RAGシステムにも、人間のように仕事してほしい」という理想を実現するための手法です。
従来のRAGでは、「文献を1回しか検索できない」など柔軟性がなく、最終的な回答が不十分になってしまうという問題がありました。普通の人間だったらここで終わらず、情報が十分になるまで調べ続けるはずです。
そこで、「Agentic RAG」という手法では、RAGシステムの中でLLM自身が、①振り返り・②計画・③ツール利用・④複数エージェントでの協力を、できる仕組みにしています。
問題意識
従来のRAGでは、柔軟性がありませんでした。例えば、普通のRAGでは「セルフチェック」するような仕組みはありません。なので基本的には、検索した内容をそのまま回答するような仕組みになります。
ただ、2024年の論文で「LLMにセルフチェック(Reflection)させると、問題解決能力が向上する」という研究があります[2]。「でしょうね。」という感じですが、普通のRAGには、この柔軟性がありません。
セルフチェックは一例であり、RAGの柔軟性の問題は他にもあります。例えば「曖昧な質問」が来ても聞き返したりできなかったり[3]、「複数要素が絡む質問」で複数回の文書検索ができなかったり[4]。
こうした問題を解決するための、個別の手法は、これまでも多くありました。しかし、「Agentic RAG」では、チマチマ手法を組み合わせず、もっと汎用的に解決できるようにしようとしています。
Agentic RAG の特徴
以下の4つの設計パターンがあります。
【設計パターン】
- Reflection(自己反省): 出力を評価し、自分で改善
- Planning(計画): 与えられたタスクを事前に細分化してから実行
- Tool Use(ツール利用): 外部APIやデータベースを活用
- Multi-Agent Collaboration(マルチエージェント協力): 複数のエージェントが協調
また、「Agentic RAG」の、ざっくり分類は以下です。
【既存のRAG、ざっくり分類】
- Naïve RAG: シンプルなRAG
- Advanced RAG: ハイブリットサーチやリランキングなどによる高度な検索
-
Modular RAG: ツール利用可能にするなどさらに複雑化、コンポーネント化
(注: 日本ではこれも含めてAdvanced RAGと呼ばれていた印象です) - Graph RAG: グラフデータ構造を利用して検索・推論強化
-
Agentic RAG: AIエージェントを利用
また、「Agentic RAG」を用いたRAGのアーキテクチャには、以下のような例があります。
【アーキテクチャ】
-
シングルエージェント型
- 1つのエージェント(LLM)が全部をこなす。
- シンプルだが、精度が一番いいとは言えない。
-
マルチエージェント型
- 複数のエージェント(LLM)がデータソースごとに存在。
- 最適なクエリで検索するなど、さらに柔軟 & 回答精度が高くなる
-
階層型エージェント
- エージェントを階層化。
- 上位エージェントが戦略決定し、下位エージェントが実行。
-
Corrective RAG(セルフチェック付きRAG)
- 検索結果が十分かどうかセルフチェック。
- 以前紹介した「CRAG」よりも少し広い概念。「CRAG」が、ここに分類されるイメージ。
-
Adaptive RAG(適応型RAG)
- ユーザーの質問内容に応じて、戦略を使い分ける。
- ※以前、こちらでも紹介しました。
-
Graph-Based Agentic RAG
- グラフDBとAIエージェントを利用したRAG。
- Agent-GやGeARなど
まとめ
こうして見ると分かるように、「AIエージェント」自体は新しくありません。例えば「Baby AGI」は2023年からありますが、これはまさに「Agentic RAG」です。
とはいえ、2025年だからこそ、ここまで「AIエージェント」が盛り上がっている意味も、わかります。2024年後半には、ツール利用の精度が上がる「Structured Output」機能が登場したり、最高性能の「o1」モデルが「Reflection」を利用するなど、AIエージェントにとって追い風がありました。
実際、こうした追い風もあり、弊社が普段の業務でお話している大企業のお客様でも、「AIエージェントを使えば、こんなこともできるのではないか」と想像がつきやすくなりました。そこから、「AIエージェント」を使った素晴らしいユースケースが、いくつも発掘されてきています。
なので、「Agentic RAG」は、単なる流行というより、普通に実務で利用できる手法ですし、今後も盛り上がると考えています。
みなさまが業務でRAGシステムを構築する際も、選択肢として参考にしていただければ幸いです。今後も、RAGの回答精度を上げるような工夫や研究について、記事にしていこうと思います。我々が開発しているサービスはこちら。
-
"Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG", Singh et al. ↩︎
-
"Self-Reflection in LLM Agents: Effects on Problem-Solving Performance", Renze et al. ↩︎
-
この記事での「曖昧な質問に弱い」問題と同様。この記事では、「AIエージェント」ではない別の方法で解決しています。 ↩︎
-
この記事での「複数要素が絡む質問に弱い」問題と同様。この記事では、「AIエージェント」ではない別の方法で解決していますが。 ↩︎
Discussion
これは、かつてfanctioncallingと呼ばれていたものとは別物なのでしょうか