「Deep Research」の「がっかり体験」を減らす手法

Atsushi Kadowaki

2025/11/04に公開

本記事では、精度の高い「Deep Research」機能を実装するための手法について、ざっくり解説します。
株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、活用可能にする」プロダクトを開発しているスタートアップです。

 この記事は何この記事は、「Deep Research」の新手法「Enterprise Deep Research (EDR)」の論文[1]について、日本語で簡単にまとめたものです。
https://arxiv.org/abs/2510.17797

 本題
 ざっくりサマリー
「EDR」は、Deep Researchの「がっかり体験」を減らすための新しい手法です。 Salesforce AI Research の研究者らによって2025年10月に提案されました。
「Deep Research」が話題です。この機能では、Web上の情報をもとに深く考え、高精度な回答ができます。しかし、Deep Researchは、「途中でやり直しがきかない」という問題があります。
通常の「Deep Research」では、一度調査を開始すると、完成まで全部「おまかせ」です。これのせいで、「AIに30分調査させたのに、全然使えないレポートが生成された」という「がっかり体験」が起きがちです。
そこで、今回紹介する 「EDR」という手法では、AIエージェントの動作中、AIのタスクに口出しできるようにしています。具体的には、「今の段階で、AIがこういうタスクに取り組んでますよ」というToDoリストを常に表示し、ユーザーがリアルタイムに軌道修正できる仕組みを提供します。

 問題意識「Deep Research」機能を自分で実装しようとすると、期待とズレた回答が来る「がっかり体験」が発生しがちでした。
例えば、GPT Researcher のような従来の「Deep Research」プロジェクトでは、一度スタートすると20-30分、AIが自分で走り続けます。そのため、最終的に生成されたレポートが、ユーザーが期待していたものと全然違う品質になってしまうことがよくあります。
また、GoogleやOpenAIのDeep Researchでは、AIの進行状況がわかるようになっているので、多少、便利です。ただ、「途中で止めたい」と思った場合、プロセスを完全停止して、またイチからやり直す必要があるため、不便です。

 手法EDRは、「途中で全消しすることなく、AIエージェントに口出しできる」ようにする手法です。具体的には「AIのToDoを常に可視化」して、「人間がリアルタイムに軌道修正」できるという特徴があります。
具体的な手順は以下です。

【ユーザーが質問を入力して来たとき】

計画立案&可視化
ユーザーの質問に対して、「Master Research Agent」という司令塔エージェントが、まず調査計画を分解し、タスクリストを作成
このタスクリストは todo.md というファイルに書き出され、ユーザーに可視化


専門エージェントが各タスクを消化
計画に基づき、Web検索・論文検索・コード検索・LinkedIn検索などの専門エージェントが、タスクを遂行


口出しへの対応
各ループ終了時に、知識ギャップを特定
ユーザーからの口出しがあれば、それを最優先でtodoに反映
不要なタスクはキャンセル、新規タスクを追加

EDRという手法のキモは、AIの暴走を可視化している部分です。AI自身が、「このままだと、こういう方向性に行っちゃいますよ」という方向性を分かりやすくユーザーに示すことで、ユーザーが口出ししやすい体験にしています。

 成果

（↑「DeepResearch Bench」のスコア表）
DeepResearch Bench や DeepConsult といった公開ベンチマークにおいて、既存のDeep Researchサービスと同等以上の性能
ユースケース評価では、社内データベースに対するSQL生成・実行精度 95%超、ユーザー満足度 4.8/5 など、高評価

 まとめ弊社では普段から、エンタープライズ向けに生成AIサービスを開発しています。ここまで述べたようなシンプルな「Deep Research」機能も自前で実装し、リリースしています。
OpenAIやGoogleの「Deep Research」の性能もかなり高いですが、「Deep Researchは、がっかり体験が多い」という感想を聞くことも多いです。
EDRという手法では「このままだとこんな方向になるよ」とユーザーに伝えることで、ユーザーが簡単にフィードバックできるようにして、期待とのズレ（がっかり具合）を無くそうとする手法です。
「がっかり体験」は、Deep Researchだけでなく、あらゆるAIエージェントで発生しています。だからこそ、EDRのような「追加指示」できる手法は、今後、あらゆるAIエージェントで、当たり前になっていくと予想します。
みなさまが業務でRAGシステムを構築する際も、選択肢として参考にしていただければ幸いです。今後も、RAGの回答精度を上げるような工夫や研究について、記事にしていこうと思います。我々が開発しているサービスはこちら。

脚注
"Enterprise Deep Research: Steerable MultiAgent Deep Research for Enterprise Analytics", Prabhakar et al. ↩︎

ナレッジセンス - 生成AIとRAGの実装戦略・技術ブログPublication

株式会社ナレッジセンスは、「大企業の知的活動を最速にする」をミッションに掲げ、社内データ検索ができるAIチャットボットを開発・提供しているスタートアップです。このブログでは、LLMや検索技術、RAGの実装戦略について知見を共有します。生成AIやRAG技術を使って最高品質の実装をしたいエンジニア向けのコンテンツです

この記事は何

本題

ざっくりサマリー

問題意識

手法

成果

まとめ

Discussion