RAGで「AIエージェント」を使う手法まとめ

Atsushi Kadowaki

2025/01/31に公開

本記事では、RAGの性能を高めるための「Agentic RAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。

 この記事は何この記事は、「AIエージェント」をRAGに取り入れた手法である「Agentic RAG」のサーベイ論文[1]について、日本語で簡単にまとめたものです。

https://arxiv.org/abs/2501.09136
今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合はこちらの記事もご参考下さい。

 本題
 ざっくりサマリー
Agentic RAG は、RAGの新しい手法です。この論文では、「RAGにAIエージェントを使っている」とはどういう状態なのか、どんなパターンがあるのかまとめられています。クリーブランド・ステート大学の研究者らによって、2025年1月に発表された論文です。
最近、「AIエージェント」が注目されています。（※こちらの記事でも2025年のトレンド予想として紹介しました）。Agentic RAG という手法は、要するに、「RAGシステムにも、人間のように仕事してほしい」という理想を実現するための手法です。
従来のRAGでは、「文献を1回しか検索できない」など柔軟性がなく、最終的な回答が不十分になってしまうという問題がありました。普通の人間だったらここで終わらず、情報が十分になるまで調べ続けるはずです。
そこで、「Agentic RAG」という手法では、RAGシステムの中でLLM自身が、①振り返り・②計画・③ツール利用・④複数エージェントでの協力を、できる仕組みにしています。

 問題意識

従来のRAGでは、柔軟性がありませんでした。例えば、普通のRAGでは「セルフチェック」するような仕組みはありません。なので基本的には、検索した内容をそのまま回答するような仕組みになります。
ただ、2024年の論文で「LLMにセルフチェック（Reflection）させると、問題解決能力が向上する」という研究があります[2]。「でしょうね。」という感じですが、普通のRAGには、この柔軟性がありません。
セルフチェックは一例であり、RAGの柔軟性の問題は他にもあります。例えば「曖昧な質問」が来ても聞き返したりできなかったり[3]、「複数要素が絡む質問」で複数回の文書検索ができなかったり[4]。
こうした問題を解決するための、個別の手法は、これまでも多くありました。しかし、「Agentic RAG」では、チマチマ手法を組み合わせず、もっと汎用的に解決できるようにしようとしています。

 Agentic RAG の特徴以下の4つの設計パターンがあります。
【設計パターン】

Reflection（自己反省）： 出力を評価し、自分で改善

Planning（計画）： 与えられたタスクを事前に細分化してから実行

Tool Use（ツール利用）： 外部APIやデータベースを活用

Multi-Agent Collaboration（マルチエージェント協力）： 複数のエージェントが協調
また、「Agentic RAG」の、ざっくり分類は以下です。
【既存のRAG、ざっくり分類】

Naïve RAG： シンプルなRAG

Advanced RAG： ハイブリットサーチやリランキングなどによる高度な検索

Modular RAG： ツール利用可能にするなどさらに複雑化、コンポーネント化

（注: 日本ではこれも含めてAdvanced RAGと呼ばれていた印象です）

Graph RAG： グラフデータ構造を利用して検索・推論強化

Agentic RAG： AIエージェントを利用


また、「Agentic RAG」を用いたRAGのアーキテクチャには、以下のような例があります。
【アーキテクチャ】

シングルエージェント型
1つのエージェント（LLM）が全部をこなす。
シンプルだが、精度が一番いいとは言えない。


マルチエージェント型
複数のエージェント（LLM）がデータソースごとに存在。
最適なクエリで検索するなど、さらに柔軟 & 回答精度が高くなる


階層型エージェント
エージェントを階層化。
上位エージェントが戦略決定し、下位エージェントが実行。

Corrective RAG（セルフチェック付きRAG）
検索結果が十分かどうかセルフチェック。
以前紹介した「CRAG」よりも少し広い概念。「CRAG」が、ここに分類されるイメージ。


Adaptive RAG（適応型RAG）
ユーザーの質問内容に応じて、戦略を使い分ける。
※以前、こちらでも紹介しました。

Graph-Based Agentic RAG
グラフDBとAIエージェントを利用したRAG。
Agent-GやGeARなど


 まとめこうして見ると分かるように、「AIエージェント」自体は新しくありません。例えば「Baby AGI」は2023年からありますが、これはまさに「Agentic RAG」です。
とはいえ、2025年だからこそ、ここまで「AIエージェント」が盛り上がっている意味も、わかります。2024年後半には、ツール利用の精度が上がる「Structured Output」機能が登場したり、最高性能の「o1」モデルが「Reflection」を利用するなど、AIエージェントにとって追い風がありました。
実際、こうした追い風もあり、弊社が普段の業務でお話している大企業のお客様でも、「AIエージェントを使えば、こんなこともできるのではないか」と想像がつきやすくなりました。そこから、「AIエージェント」を使った素晴らしいユースケースが、いくつも発掘されてきています。
なので、「Agentic RAG」は、単なる流行というより、普通に実務で利用できる手法ですし、今後も盛り上がると考えています。
みなさまが業務でRAGシステムを構築する際も、選択肢として参考にしていただければ幸いです。今後も、RAGの回答精度を上げるような工夫や研究について、記事にしていこうと思います。我々が開発しているサービスはこちら。

脚注
"Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG", Singh et al. ↩︎
"Self-Reflection in LLM Agents: Effects on Problem-Solving Performance", Renze et al. ↩︎
この記事での「曖昧な質問に弱い」問題と同様。この記事では、「AIエージェント」ではない別の方法で解決しています。 ↩︎
この記事での「複数要素が絡む質問に弱い」問題と同様。この記事では、「AIエージェント」ではない別の方法で解決していますが。 ↩︎

ナレッジセンス - 生成AIとRAGの実装戦略・技術ブログPublication

株式会社ナレッジセンスは、「大企業の知的活動を最速にする」をミッションに掲げ、社内データ検索ができるAIチャットボットを開発・提供しているスタートアップです。このブログでは、LLMや検索技術、RAGの実装戦略について知見を共有します。生成AIやRAG技術を使って最高品質の実装をしたいエンジニア向けのコンテンツです

Discussion

a1134mt

これは、かつてfanctioncallingと呼ばれていたものとは別物なのでしょうか