🐈

生成AIにおけるRAGの最新手法、メリット・デメリット

2025/01/24に公開

※ この記事はDeep Researchによってリサーチしたアウトプットを記録しただけのものです。


近年のAI技術の進歩は目覚ましく、特に生成AIは目覚ましい発展を遂げています。 IDCの調査によると、2022年の生成AI市場規模は107億ドルに達し、2026年には326億ドルに達すると予測されています。しかし、生成AIは、その出力の質、正確性、信頼性において、まだ改善の余地があります。そこで注目されているのが、Retrieval Augmented Generation (RAG)です。RAGは、外部の知識ソースから関連情報を取得し、生成AIのパフォーマンスを向上させる技術です。

本稿では、生成AIにおけるRAGの最新手法、メリット・デメリットを以下の観点から詳細に記述します。

(1) RAGとは何か?その目的と基本的な仕組み

Retrieval Augmented Generation (RAG) とは、自然言語処理 (NLP) の技術の一つで、検索ベースのAIモデルと生成ベースのAIモデルの両方の強みを組み合わせたものです 1。生成AIモデルが外部の知識ベースにアクセスし、より正確で関連性の高い回答を生成することを可能にする技術です 2。従来の生成AIモデルは、学習データに含まれる情報に限定され、最新情報や特定の分野の専門知識を反映することが難しいという課題がありました。RAGは、この課題を克服するために開発されました 3。 RAGにより、生成AIモデルは、最新の研究成果、統計データ、ニュースなど、外部の知識ソースから最新の情報を取り込むことができます 3。また、企業は、RAGを使用してLLMの情報源を制御し、変更することで、変化する要件や部門横断的な使用に適応させることができます 3。

RAGの基本的な仕組みは、以下の通りです 4。

  1. 検索と前処理: 生成AIモデルが生成したクエリを用いて、Webページ、知識ベース、データベースなどの外部データソースから関連情報を検索します。取得した情報は、トークン化、ステミング、ストップワードの除去などの前処理が行われます。
  2. 根拠に基づく生成: 前処理された情報は、事前学習済みの大規模言語モデル (LLM) に組み込まれます。これにより、LLMのコンテキストが強化され、トピックに関するより包括的な理解が可能になります。その結果、LLMはより正確で有益、かつ魅力的な回答を生成することができます。

検索には、通常、ベクトルデータベースに格納された埋め込みと、高度なランキングおよびクエリ書き換え機能を使用するセマンティック検索エンジンが使用されます。これにより、結果がクエリに関連し、ユーザーの質問に回答できるようになります 4。

RAGは、LLMが「幻覚」を起こす、つまり、もっともらしく聞こえるが実際にはデータやドキュメントで裏付けられていない回答を生成するのを防ぐのにも役立ちます 4。RAGは、入力プロンプトの一部としてLLMに「事実」を提供することで、これを軽減します。このアプローチの核心は、最も関連性の高い事実をLLMに提供し、LLMの出力がそれらの事実に完全に基づいていることを保証することです。同時に、ユーザーの質問に答え、システムの指示と安全性の制約に準拠する必要があります 4。

RAGの登場は、2020年にPatrick Lewis氏らが発表した論文に端を発します 6。彼らは、生成AIサービスを外部リソース、特に最新の技術的詳細が豊富なリソースにリンクさせるためにRAGを開発しました。この論文では、RAGを「汎用的な微調整レシピ」と呼んでおり、それは、ほぼすべてのLLMが実質的にあらゆる外部リソースと接続するために使用できるためです 6。

(2) 最新のRAG手法

RAGは、近年急速に発展しており、様々な手法が提案されています 7。ここでは、代表的な最新手法とその特徴について解説します。

手法 特徴
Simple RAG ユーザーのクエリに基づいて関連ドキュメントを取得し、LLMを用いて応答を生成する基本的な手法です。
Active RAG ユーザからのフィードバックを基にクエリを反復的に改良し、関連性を向上させる手法です。
Corrective RAG 生成された出力を修正またはクロスチェックし、事実の正確性を保証する手法です。
Self RAG 自己反省または自己批判によってRAG結果の質を向上させる手法です。LLMが各回答を批評して、クエリに関連しているかどうかを判断します。関連性がない場合は外部ソースを使用し、関連性がある場合は幻覚と正確性をチェックします。
Speculative RAG 特定のクエリに対して複数の応答を生成し、取得モデルを活用して関連情報を提供する手法です。これらの応答は、グレーディングシステムを通じて評価され、最も正確で文脈的に適切な応答が選択されます。
Multimodal RAG テキスト、画像、動画など、複数のデータタイプを組み込み、よりリッチな応答を生成する手法です。
Advanced RAG 高密度検索やTransformerなどの最先端の検索手法を用いて、高性能な検索を実現する手法です。
Knowledge-intensive RAG 専門的またはドメイン固有の情報に特化した手法です。
Memory RAG 過去のやり取りを記憶し、将来の応答の質、継続性、パーソナライズを向上させる手法です。
Meta-learning RAG 少数ショット学習またはゼロショット学習機能により、迅速に適応する手法です。
HtmlRAG HTMLを直接使用して、見出しや表などの貴重な情報構造をプレーンテキストの代わりに保持する手法です。HTMLからの余分なノイズとサイズを処理するために、クリーニングとプルーニング技術を適用します。
FastRAG スキーマとスクリプト学習を使用してデータを効率的に処理し、AIモデルに完全に依存しない手法です。テキスト検索とナレッジグラフのクエリを組み合わせることで、精度を向上させ、処理時間を90%、コストを85%削減します。
Auto-RAG LLMを使用してクエリを絞り込み、十分な情報が集まるまで複数ターンの対話を通じて取得を計画する自律的な手法です。この微調整されたシステムは、質問の難易度に合わせて適応し、そのプロセスを自然言語で説明します。
CORAG チャンク間の相関関係を考慮し、チャンクを追加することの非単調な効用に対処するためのモンテカルロ木探索 (MCTS) フレームワークを使用する手法です。また、設定エージェントを使用して、さまざまなクエリタイプに適応します。
MemoRAG 長期記憶を備えたデュアルシステムアプローチを採用する手法です。軽量なLLMがデータベースの「グローバルメモリ」を作成し、取得ツールをガイドするための回答のドラフトを生成する一方で、より強力なLLMが取得したデータを使用して最終的な回答を生成します。
RAG-Thief プライベートナレッジベースとLLMを統合するRAGシステムにおけるプライバシーリスクを明らかにするために設計された手法です。敵対的なクエリから始めて、応答から学習してより効果的なクエリを生成することにより、プライベートデータを自動的に抽出します (70%以上)。
AssistRAG ツール、メモリ、計画を管理するためのインテリジェントアシスタントをLLM内に組み込む手法です。情報検索と意思決定を強化するために、カリキュラムアシスタント学習と強化された選好最適化の2段階のトレーニングプロセスを使用します。
LaB-RAG 画像ラベルとRAGおよびLLMを組み合わせて画像キャプションを生成する手法です。単純な分類器を使用してX線画像をテキストラベルに変換します。これらのラベルは、事前学習済みLLMがLLMをトレーニングしたり、画像データを直接使用したりすることなく、詳細な放射線レポートを生成するのに役立ちます。
Video-RAG 広範な微調整なしにモデルの長編動画の理解を深める、軽量で費用対効果の高いソリューションです。プラグアンドプレイ方式を採用し、オープンソースツールを使用して動画から位置合わせされた情報を抽出し、このデータを補助テキストとしてLVLMと統合します。
Retrieval-Augmented Forecasting (RAF) Chronosなどの時系列基盤モデル (TSFM) を強化し、関連する時系列の例を動的に取得して予測を改善する手法です。時系列データのイベント駆動型で進化する性質に対処します。
RuAG LLMの常識を使用して述語を定義し、モンテカルロ木探索 (MCTS) を使用してデータを効率的に探索することにより、大規模なデータセットを解釈可能なロジックルールに変換する手法です。次に、ロジックルールは自然言語に変換され、LLMプロンプトに統合され、推論能力を高めます。
MMed-RAG 診断やレポート生成などのタスクにおける医療ビジョン言語モデルの事実精度を向上させるように設計されたマルチモーダルRAGシステムです。また、適応コンテキスト選択と選好微調整を使用して、幻覚やミスアライメントなどの問題にも対処します。
Path-RAG PathVQA-Openタスクの病理画像分析を改善することにより、がん診断を強化するフレームワークです。HistoCartographyを使用して画像から知識を抽出し、専門家の洞察を組み込むための重要なパッチを選択し、精度を38%から47%に向上させ、長文の質問応答を改善します。

(3) 各手法のメリットとデメリット

各RAG手法は、それぞれ異なる特徴を持つため、メリットとデメリットも異なります。ここでは、性能向上、効率性、適用範囲、実装の容易さの観点から比較を行います。

RAG Technique Advantages Disadvantages
Simple RAG - 広範囲のタスクやデータに対応可能 8
- 計算コストが低く、処理速度が速い 8
- 必要なデータ量が少ない 8
- 実装が比較的容易 8
- 複雑なクエリや高度な推論には不向き
Active RAG - ユーザーフィードバックにより、出力の質、正確性、信頼性を向上 10 - ユーザーフィードバックの収集と処理が必要
- Simple RAGよりも計算コストが高い
Corrective RAG - 事実の正確性を保証 8
- 信頼性の高い出力を得られる
- Simple RAGよりも計算コストが高い 8
- 修正処理の実装が複雑
Self RAG - 自己反省により、出力の質を向上
- 幻覚の発生を抑制
- Simple RAGやCorrective RAGよりも計算コストが高い 8
- 実装が複雑 8
Speculative RAG - 曖昧なクエリや複数の解釈が可能なクエリに対応可能 8 - Self RAGよりも計算コストが高い 8
- 実装が複雑 8
Multimodal RAG - 複数のデータタイプを組み合わせ、より包括的な理解に基づいた出力を生成 7 - 複数のデータタイプを処理するための前処理が必要
- 計算コストが高い
Advanced RAG - 高度な検索手法により、出力の質を向上 7 - 計算コストが高い
- 高度な検索手法の実装が複雑
Knowledge-intensive RAG - 特定分野の出力の質、正確性を向上 7 - 専門的な知識ベースの構築が必要
- 適用範囲が限定的
Memory RAG - 過去のやり取りを記憶し、パーソナライズされた出力を生成 7 - メモリ管理の仕組みが必要
- プライバシーへの配慮が必要
Meta-learning RAG - 新しいタスクやデータに迅速に適応 7 - 学習データの選定が重要
- 計算コストが高い
HtmlRAG - 見出しや表などの情報構造を保持 9 - HTMLからのノイズ処理が必要
FastRAG - 処理時間とコストを大幅に削減 9 - スキーマとスクリプト学習の適用範囲が限定的
Auto-RAG - 質問の難易度への適応性が高い 9 - 複数ターンの対話処理が必要
- 実装が複雑
CORAG - チャンク間の相関関係を考慮 9 - モンテカルロ木探索の実装が複雑
MemoRAG - 軽量なLLMと強力なLLMの組み合わせにより効率的な処理を実現 9 - デュアルシステムの構築が必要
RAG-Thief - プライバシーリスクの分析に有効 9 - 実装に専門的な知識が必要 9
AssistRAG - ツール、メモリ、計画の管理が可能 9 - 実装が複雑 9
LaB-RAG - 画像キャプション生成に特化 9
- 軽量で費用対効果が高い 9
- 画像分類器の精度に依存
Video-RAG - 長編動画の理解を深める 9
- 軽量で費用対効果が高い 9
- 動画データの前処理が必要
Retrieval-Augmented Forecasting (RAF) - 時系列データの予測精度を向上 9 - 時系列データに特化
RuAG - データを解釈可能なロジックルールに変換 9 - モンテカルロ木探索の実装が複雑
MMed-RAG - 医療分野の画像と言語の処理に特化 9 - 医療データに特化
Path-RAG - がん診断などの病理画像分析に特化 9 - 病理画像分析に特化

上記の表からわかるように、各RAG手法はそれぞれ異なるメリットとデメリットを持っています。

例えば、Simple RAGは、広範囲のタスクに適用でき、実装も比較的容易ですが、複雑なクエリや高度な推論には不向きです。一方、Active RAGは、ユーザーフィードバックを反映することで出力の質を向上させることができますが、フィードバックの収集と処理にコストがかかります。

このように、RAG手法を選択する際には、タスクの要件、データの種類、利用可能なリソースなどを考慮し、最適な手法を選ぶ必要があります。

ベンチマークツールとデータセット

LLMをRAGでベンチマークするためのツールとデータセットがいくつかあります 7。

  • Natural Questions (NQ) データセット: これは、通常Wikipediaからの取得を必要とする、長答と短答タイプの現実世界の質問を含むデータセットです。NQは、関連ドキュメントを取得し、正確で事実に基づいた回答を生成するモデルの能力を測定します。そのため、質問応答タスクにおけるRAGのパフォーマンスを評価するのに最適です。
  • MS MARCO (Microsoft Machine Reading Comprehension): MS MARCOは、Bing検索ログからの実際のクエリと、対応する文章と回答を含む、ドキュメント検索と文章ランキングのための大規模なデータセットです。RAGが最も関連性の高い文章を取得し、質の高い、首尾一貫した回答を生成する能力をテストするために使用されます。
  • TriviaQA: この質問応答データセットは、質問と正しい回答を含むWebドキュメントをペアにします。RAGが関連する事実情報を取得し、それを正確な応答に組み込むことができるかどうかを評価します。特に、トリビアベースまたは一般知識のクエリに適しています。
  • FEVER (Fact Extraction and Verification): このデータセットは、事実検証と取得のために設計されています。FEVERは主張を提供し、モデルに証拠を取得して主張の正確性を検証するように求めます。RAGが関連する証拠をどれだけうまく取得し、事実に基づいた、根拠のある応答を生成するかを評価するのに最適です。

(4) 特定のユースケースにおけるRAGの有効性

RAGは、様々なユースケースにおいて有効性を発揮します。ここでは、具体的な事例を交えて説明します。

  • 質問応答: 質問応答システムにおいて、RAGは、質問に関連する情報を外部知識ソースから取得し、より正確で詳細な回答を生成することができます。例えば、法律に関する質問に対して、RAGは関連する法律条文や判例を検索し、その情報に基づいた回答を生成することができます 11。 Cohesity Gaiaは、RAG AIを使用して日常言語でコンテンツを検索および要約し、会話型クエリを作成する例です 1。Cohesity Gaia RAGプラットフォームは、質問やクエリなど、人間および機械による入力を受け入れます。その入力は、エンタープライズバックアップデータのペタバイトをコンテキスト化されたデータのより小さなサブセットにすばやくフィルターするキーワードでトークン化されます。次に、質問またはクエリに最も関連性の高い、それらのドキュメントまたはオブジェクト内の表現を選択します。その結果は、元のクエリとともに、GPT4などのLLMにパッケージ化され、コンテキストを認識した人間らしい回答を提供します。
  • 文章要約: 長文の要約タスクにおいて、RAGは、重要な情報を外部知識ソースから取得し、より要約性の高い文章を生成することができます。例えば、ニュース記事の要約において、RAGは記事に関連する背景情報や補足情報を検索し、それを要約に含めることができます 12。
  • 翻訳: 翻訳タスクにおいて、RAGは、翻訳対象の文章に関連する情報を外部知識ソースから取得し、より自然で正確な翻訳を生成することができます。例えば、専門用語の翻訳において、RAGは専門用語辞典や技術文書を検索し、適切な訳語を選択することができます 12。
  • チャットボット: RAGは、チャットボットなどのリアルタイムアプリケーションで特に役立ちます。RAGを使用すると、チャットボットは最新の情報を提供できます。たとえば、航空会社のチャットボットでRAGを使用すると、顧客は最新のオプションを提供することで、代替のフライトや座席を見つけることができます 13。
  • Eコマース: RAGは、ユーザーの好みや製品の詳細に関する情報を取得して組み込むことで、Eコマースでのユーザーエクスペリエンスを向上させ、より関連性の高いパーソナライズされた製品レコメンデーションを提供できます 11。
  • 製造業: 製造業では、RAGは工場のプラントの運用など、重要な情報にすばやくアクセスするのに役立ちます。また、意思決定プロセス、トラブルシューティング、組織の革新にも役立ちます。厳格な規制の枠組み内で運営されている製造業者の場合、RAGは業界標準や規制機関など、社内および社外のソースから更新された規制やコンプライアンス基準を迅速に取得できます 11。
  • 医療: RAGは、正確でタイムリーな情報へのアクセスが不可欠な医療業界で可能性を秘めています。RAGは、外部ソースから関連する医学的知識を取得して組み込むことで、医療アプリケーションでより正確でコンテキストを認識した応答を提供できます。このようなアプリケーションは、人間の臨床医がアクセスできる情報を増強します。最終的に判断を下すのはモデルではなく、人間の臨床医です 11。

(5) RAGの今後の発展方向性、課題、可能性

RAGは、生成AIの性能を向上させるための重要な技術として、今後も更なる発展が期待されます。今後の発展方向性としては、以下のような点が挙げられます 14。

  • より高度な検索手法の導入: Transformerなどの最新技術をRAGに導入することで、より関連性の高い情報を効率的に検索することが可能になります。
  • マルチモーダルRAGの発展: テキストだけでなく、画像、音声、動画などの様々なデータタイプを統合することで、よりリッチで表現力豊かな出力を生成することが可能になります。
  • パーソナライズ化: ユーザの好みや状況に合わせて、よりパーソナライズされた情報を提供することで、ユーザ満足度を向上させることができます。
  • 自己質問型RAG: システムが複雑な質問を自動的に分解できるようにすることで、深い学習技術が可能になります。
  • 適応検索: 事実の質問と創造的なタスクに異なるアプローチを使用するなど、クエリタイプに基づいて検索戦略を調整します。
  • ハイブリッド検索: キーワードマッチングやセマンティック検索など、さまざまな検索方法を組み合わせることで、単一のアプローチでは見落とされる可能性のある関連情報を取得します。

一方で、RAGには、以下のような課題も存在します 12。

  • データバイアス: 外部知識ソースにバイアスが含まれている場合、生成AIの出力にもバイアスが反映される可能性があります。バイアスを特定して修正するためのアルゴリズムソリューションを実装する必要があります。また、偏りのない多様なデータセットを作成する必要があります。
  • セキュリティとプライバシー: 外部知識ソースに機密情報が含まれている場合、セキュリティとプライバシーの保護が重要になります。組織は、データの暗号化や安全なアクセス制御など、厳格なセキュリティ対策を採用して、機密情報を保護し、信頼を維持する必要があります。
  • 計算コスト: 大規模な外部知識ソースを利用する場合、計算コストが高くなる可能性があります。
  • 取得されたドキュメントの品質と関連性への依存: RAGシステムの有効性は、取得コンポーネントが膨大なデータベースまたはドキュメントのコレクションから適切で正確な情報をどれだけうまく調達できるかに根本的に関連しています。取得プロセスが失敗した場合、無関係な、古い、または不正確なドキュメントを取得することにより、欠陥のある、または誤解を招く出力が生成される可能性があります。
  • RAGの実装はリソースを大量に消費する作業: RAGの実装には、さまざまなソースからの同時データ取得と、コンテンツの生成に関連する複雑なプロセスを管理できる堅牢なインフラストラクチャが必要になるため、大量のリソースが必要になる可能性があります。

これらの課題を克服することで、RAGは、より信頼性が高く、安全で、効率的な技術として、様々な分野で活用されることが期待されます。

結論

RAGは、生成AIの出力の質、正確性、信頼性を向上させるための重要な技術です。様々な手法が提案されており、それぞれメリットとデメリットがあります。ユースケースに応じて適切な手法を選択することが重要です。RAGは、今後も更なる発展が期待され、様々な分野で活用されることで、社会に大きなインパクトを与える可能性を秘めています。 RAGは、AIが常に最新かつ関連性の高い情報で動作できるようにすることで、ニュース、金融、医療研究など、情報が急速に変化する動的な環境において非常に貴重なツールになります 12。 RAGは、AI技術の開発に大きな期待を抱いています。関連データへの迅速なアクセスを促進することにより、RAGは研究期間を大幅に短縮し、正確でタイムリーな情報で研究開発イニシアチブをサポートできます 15。

引用文献

1. What is retrieval augmented generation?| Glossary - Cohesity, 1月 24, 2025にアクセス、 https://www.cohesity.com/glossary/retrieval-augmented-generation-rag/
2. What Is RAG? Retrieval-Augmented Generation Explained - Intel, 1月 24, 2025にアクセス、 https://www.intel.com/content/www/us/en/learn/what-is-rag.html
3. What is RAG? - Retrieval-Augmented Generation AI Explained - AWS, 1月 24, 2025にアクセス、 https://aws.amazon.com/what-is/retrieval-augmented-generation/
4. What is Retrieval-Augmented Generation (RAG)? | Google Cloud, 1月 24, 2025にアクセス、 https://cloud.google.com/use-cases/retrieval-augmented-generation
5. Retrieval Augmented Generation: Grounding AI Responses in Factual Data - Medium, 1月 24, 2025にアクセス、 https://medium.com/@minh.hoque/retrieval-augmented-generation-grounding-ai-responses-in-factual-data-b7855c059322
6. What Is Retrieval-Augmented Generation aka RAG | NVIDIA Blogs, 1月 24, 2025にアクセス、 https://blogs.nvidia.com/blog/what-is-retrieval-augmented-generation/
7. Retrieval Augmented Generation: Everything You Need to Know About RAG in AI - WEKA, 1月 24, 2025にアクセス、 https://www.weka.io/learn/guide/ai-ml/retrieval-augmented-generation/
8. 6 Types of Retrieval-Augmented Generation (RAG) Techniques You Should Know - Medium, 1月 24, 2025にアクセス、 https://medium.com/@homayoun.srp/6-types-of-retrieval-augmented-generation-rag-techniques-you-should-know-b45de9071c79
9. 16 New Types of Retrieval-Augmented Generation (RAG) - Turing Post, 1月 24, 2025にアクセス、 https://www.turingpost.com/p/16-new-types-of-rag
10. The Contrast Between RAG and Fine-Tuning Models for Tech Enthusiasts — AI Simplified, 1月 24, 2025にアクセス、 https://geekyants.com/blog/the-contrast-between-rag-and-fine-tuning-models-for-tech-enthusiasts--ai-simplified
11. Use cases for Retrieval Augmented Generation - AWS Prescriptive Guidance, 1月 24, 2025にアクセス、 https://docs.aws.amazon.com/prescriptive-guidance/latest/retrieval-augmented-generation-options/rag-use-cases.html
12. Top Use Cases of Retrieval-Augmented Generation (RAG) in AI - Glean, 1月 24, 2025にアクセス、 https://www.glean.com/blog/retrieval-augmented-generation-use-cases
13. What is Retrieval Augmented Generation (RAG)? - Confluent, 1月 24, 2025にアクセス、 https://www.confluent.io/learn/retrieval-augmented-generation-rag/
14. RAG in 2025: Smarter Retrieval and Real-Time Responses - Dataforest, 1月 24, 2025にアクセス、 https://dataforest.ai/blog/rag-in-2025-smarter-retrieval-and-real-time-responses
15. RAG: The Future of Reliable and Accurate Generative AI - Dataversity, 1月 24, 2025にアクセス、 https://www.dataversity.net/rag-the-future-of-reliable-and-accurate-generative-ai/
16. The Future of Retrieval-Augmented Generation (RAG): Emerging Trends and Innovations, 1月 24, 2025にアクセス、 https://medium.com/@raghav_47115/the-future-of-retrieval-augmented-generation-rag-emerging-trends-and-innovations-f6638526143a
17. Retrieval-Augmented Generation (RAG): Overview, Benefits & Limitations - Kiteworks, 1月 24, 2025にアクセス、 https://www.kiteworks.com/risk-compliance-glossary/retrieval-augmented-generation/

Discussion