Zenn
🐈

検索×生成AIの未来「DeepRAG」

2025/03/09に公開
3

この記事で分かる事

  • 従来のRAGとの違い
  • DeepRAGの仕組み
  • DeepRAGの実装方法

検索×生成AIの進化

近年、生成AIと情報検索を統合する技術が飛躍的に進化しています。その最前線に位置するのがOpenAIの「DeepResearch」 です。DeepResearchは、従来の大規模言語モデル(LLM)の弱点を補う形で、リアルタイムの情報取得と高度な分析機能を融合させたアプローチ を採用し、情報支援を提供しています。

Xでも評判になっていました。驚異的な進歩の一方で、将来的にまだまだ改善の余地はありそうです。

検索×生成AIの進化は間違いなく今後もトレンドになっていくでしょう。

今回紹介するDeepRAGは、こうした検索×生成AI分野において注目の技術です。

https://x.com/kamui_qai/status/1886353828163006644

従来のRAGの問題点

情報検索と生成を組み合わせたRetrieval-Augmented Generation(RAG)モデルは、より高度な文章生成の手法として注目されています。しかし、従来のRAGにはいくつかの課題と制約があり、特に複雑な情報収集や正確性の向上において限界が指摘されています。

単回検索による情報収集の限界

従来のRAGモデルは、1回の検索結果に基づいて回答を生成する 仕組みとなっています。そのため、多段階の検索が必要な複雑な問題には対応しにくいです。例えば、異なる情報源を照合しながら答えを導き出すようなケースでは、1回の検索では情報が不足し、正確な回答を生成することが難しくなります。

検索プロセスの最適化不足

検索アルゴリズムが十分に最適化されていない場合、関連性の低い情報を取得しやすく、結果として生成される文章の品質が低下するリスクがあります。適切な情報フィルタリングやランキングの仕組みが不十分な場合、モデルが不適切なデータを参照してしまい、誤った回答を出す可能性が高まります。

取得情報の信頼性評価が難しい

従来のRAGモデルには、検索された情報の信頼性を評価する機能が限定的 であるという問題があります。つまり、取得した情報が誤っていた場合でも、それを検証する仕組みがないため、そのまま生成内容に反映されてしまいます。これにより、誤情報が混入するリスクが高まり、ユーザーが誤った知識を得る原因となります。

データ更新の難しさ

RAGモデルは、事前に学習されたデータと検索エンジンを活用しますが、新しい情報を迅速に反映するのが難しい という制約があります。一度トレーニングされたモデルは、学習時点のデータに基づいて動作するため、リアルタイムの情報や最新の知識を反映するのが困難となります。その結果、時間の経過とともにモデルの精度が低下してしまいます。

DeepRAGとは

DeepRAGとは、リアルタイム情報を活用する次世代NLPモデルです。

従来のNLPモデルは、一度学習した知識が固定化されるため、最新のニュースや動向をリアルタイムで反映することが困難でした。RAG(Retrieval-Augmented Generation)は、この課題を克服するために、外部情報を検索し、それをもとに回答を生成する手法として登場しました。 しかし、従来のRAGは検索プロセスが単純で、取得した情報の統合・解釈に限界があり、文脈に最適化された柔軟な回答生成には課題が残っていました。

DeepRAGは、検索プロセスを高度に最適化し、動的な情報統合を可能にすることで、より精緻な検索結果を取得し、文脈に応じた高精度な回答を生成します。 これにより、静的な知識に依存することなく、リアルタイムでの情報取得と高度な応答性能を実現し、従来のRAGを大きく上回る柔軟な情報処理が可能となります。

上記の仕組みにより、DeepRAGは次のような利点を持ちます。

  1. 最新情報の活用:検索を通じて常に最新のデータを取得し、それを反映した回答を生成できます。
  2. 知識の固定化を回避:従来のモデルのように学習データに依存せず、情報の鮮度を維持できます。
  3. 効率的な情報検索:必要最小限の検索を行いながらも、十分な情報を確保することで、適切な回答を生成します。

このように、DeepRAGは従来のNLPモデルの制約を打破し、リアルタイムでの情報検索と回答生成を組み合わせた柔軟なシステムを実現しています。

DeepRAGの手法

DeepRAGの実装は、大きく 「精度向上プロセス」 と 「基本実装」 の2つに分けられます。

処理フローの説明としては、下記のようになります。

精度向上プロセス(校正チェーン・検索の最適化)

基本実装(サブクエリの生成・バイナリツリー検索)

流れとしては、精度向上プロセスでDeepRAGの特徴であるサブクエリの生成・バイナリツリー検索の下地を作成するイメージです。

DeepRAGの精度向上プロセス

  • 校正チェーン
  • 検索の最適化

知識の境界を認識:校正チェーンで検索精度を向上

LLMは、自身の知識の限界を正確に把握するのが苦手です。そのため、「検索すべきかどうか」を誤って判断することが多いです。DeepRAGでは、「校正チェーン(Chain of Calibration)」 を導入し、検索判断の精度を向上させます。

このプロセスでは、検索の有無に関するデータセットを用いたファインチューニング を行い、最適な検索判断を学習することを目的としています。

校正チェーンプロセス

  • 模倣学習
  • バイナリツリー検索の微調整

DeepRAG では 模倣学習で基礎を作り、ファインチューニングで精度を高めるという形で 両者を補完的に活用 しています。それぞれの強みを活かしながら、検索判断の精度を向上させています。

校正チェーン

🔍 模倣学習と検索判断のファインチューニングの違い🔍

項目 模倣学習 検索判断のファインチューニング
目的 検索の基礎ルールを学習 させる 検索判断のミスを修正し、精度を向上させる
データの作り方 人間が用意したラベル付きデータ(事前に作成された検索の正解リスト)を使う LLMが実際に検索判断を行った結果 から、誤判定データを集め、再度ラベル付けする
学習のタイミング 最初の学習段階 で検索の基準を教える 運用後の調整段階 で検索ミスを修正
具体的な例 「2023年のAI技術の進展は?」は検索すべき、というルールを人が作成し、それをLLMに学習させる LLMが「検索不要」と判断したが、実際は検索すべきだった場合、その誤判定データを使って修正する
学習の内容 「検索すべきか、検索不要か」のルールを理解させる 誤った検索判断を微調整・修正し、より賢い判断ができるようにする

なぜ両方を使うのか?

  • 模倣学習だけでは不十分
    → 初期段階で検索のルールを学べても、現実の検索状況における細かな判断ミスは避けられないので、模範学習で検索のルールを初期設定します。
  • ファインチューニングだけでは効率が悪い
    → もし最初からファインチューニングだけを行うと、ラベル付けの手間がかかりすぎるため、模倣学習で基礎を作ったうえで微調整するほうが効率的になります。

🛠 校正チェーンの役割🛠

調整前(バイナリツリー検索のみ) 調整後(校正チェーン適用)
「LLMが知ってる」と誤判定して検索を省略してしまう 本当に検索すべきかを正しく判断できる
不要な検索をしてしまい、時間がかかる 無駄な検索を減らし、効率的に検索できる
古い情報を検索せずに使ってしまう 最新の情報を取得するようになる

模倣学習とは

模倣学習(Imitation Learning)とは、人間が正しい検索判断をしたデータを元に、LLMに検索の基準を学ばせるプロセスです。

これは、検索判断の 基礎を作るための学習になります。

つまり、「どんな質問は検索すべきで、どんな質問は検索不要か?」を最初に学ばせるステップ です。

バイナリツリー検索の微調整とは

バイナリツリー検索の微調整とは検索の要否をより正確に判断できるようにデータを最適化。

つまりLLMが検索判断でミスをしたデータを元に、再度ラベル付けをして修正します。つまり従来のファインチューニングです。

検索の最適化:検索結果と内部知識の融合

DeepRAGの精度向上プロセルの最終ステップでは、検索結果とLLMの内部知識を統合し、最も正確で一貫性のある回答を生成します。このプロセスでは、複数の情報ソースを適切に組み合わせることで、次のような効果を得ます。

  • 矛盾のない、統一された回答の作成
  • 信頼性の高い情報のみを活用
  • 検索の必要性を最適化し、無駄な検索を削減

つまり、検索の最適化とは、検索判断のルールを明確に定め、バイナリツリー検索の精度をさらに向上させるプロセスです。

模倣学習とファインチューニングによって検索判断の基礎を固めた後、検索の最適化では検索が必要なケース・不要なケースを明確化し、最適な検索戦略を実装します。このルールを組み込むことで、DeepRAGはより効率的に検索を活用し、正確な情報を提供できるようになります。

DeepRAGの基本実装

  • サブクエリの生成
  • バイナリツリー検索

質問の分解:サブクエリの生成で最適な検索戦略を決定

従来のRAGでは、ユーザーの質問に対して一括で検索を実行していました。しかし、DeepRAGは質問を複数のサブクエリに分解し、それぞれの検索の必要性を個別に判断します。

例えば、「2023年のAI技術の進展について教えて」という質問があった場合、

  • 「2023年」
  • 「AI技術」
  • 「進展」

といったキーワードごとにサブクエリを作成し、それぞれの要素について検索が必要かどうかを判定します。これにより、検索の無駄を削減し、必要な情報だけを取得する効率的な戦略 を取ることが可能になります。

検索の最適化:バイナリツリーを活用し無駄を排除

サブクエリを生成した後、DeepRAGはバイナリツリー検索 を活用して検索の必要性を評価します。これにより、検索プロセスを最適化し、必要な検索のみを実行します。

  • 検索が不要な場合:LLMの内部知識のみで回答を生成し、検索を省略。
  • 検索が必要な場合:外部データベースやドキュメント検索を実行し、関連情報を取得。

この仕組みにより、検索回数を最小限に抑えながら、最適な情報収集が可能となります。

成果

  • 従来手法と比較して回答精度が平均21.99%向上
  • 検索回数を削減しながら精度を向上させることに成功しています

おわりに

DeepRAGは、従来のRAGの課題を克服し、より精度の高い情報検索と回答生成を可能にする手法です。従来のRAGでは検索が1回のみで最適化されておらず、不要な検索や誤情報のリスクがありましたが、DeepRAGは質問の分解、検索の最適化、校正チェーンの導入、最終回答の統合といったプロセスを通じて、検索の必要性を正しく判断し、最新かつ関連性の高い情報を活用できるようになりました。

今後、DeepRAGはさまざまな分野で応用される可能性があり、より高度な情報検索・活用の基盤技術として発展が期待できます。

DeepRAGを含むRAGの高度化は、嘘をつかないAIを実現してくれるでしょう。情報検索と生成の融信頼性の高いアウトプットが得られるようになります。
今後に期待したいですね。

エンジニア採用

株式会社Wanderlustは、東京大学・松尾研発のグローバルAIスタートアップです。

実務経験を積みたいエンジニアを広く募集しています。気軽にご応募ください。

https://wander-lust.io/

【応募概要】

  • 時給: 1,500円-6,000円
  • 職種: AI/LLMエンジニア、AI/画像認識エンジニア、バックエンドエンジニア、クラウドエンジニア
  • 勤務地: 神保町/リモートワーク可
  • 歓迎要件: 英語ネイティブ、Atcoder/Kaggle経験者、フルコミット可能な学生(休学者歓迎)、海外大学院進学志望者
  • 必要開発経験: 未経験可(ただしその場合、相当量のコミットメントを求めます)

【インターン詳細】

https://maddening-conga-35e.notion.site/We-are-hiring-8956d0b3e0ab447eadb4d2a69342a47b?pvs=74

【応募フォーム】

https://docs.google.com/forms/d/1Hph-JgnQAvO8VNn1TpOEIYLu-890Q-LwWrchl5n-4dk/edit

参考記事

https://www.issoh.co.jp/tech/details/5333/

https://zenn.dev/knowledgesense/articles/034b613c9fd6d3

https://arxiv.org/abs/2502.01142v1

https://x.com/kamui_qai/status/1886353828163006644

3

Discussion

ログインするとコメントできます