LangChain Open Deep Researchを理解する

Open Deep Researchとは
LangChainが提供するオープンソースのリサーチアシスタント
あらゆるトピックに関する包括的なレポートを作成できる
「ワークフロー」と「マルチエージェント」の2つのアプローチを提供されている。
- ワークフロー実装は構造化されたプラン・実行方式で人間のフィードバックを取り入れる設計
- マルチエージェント実装はスーパーバイザーとリサーチャーのアーキテクチャで並列処理

ワークフロー
1)テーマ入力 →
2)プランナーが章立て案を作成 →
3)ユーザー承認(人間フィードバック)→
4)各章を順番に「検索→執筆→検索…」して完成 →
5)レポート完成

マルチエージェント
マルチエージェント:
1)テーマ入力 →
2)Supervisor が章立てを作成 →
3)各 Researcher に並列タスク配分 →
4)各 Researcher が独立に章を完成 →
5)Supervisor が導入・結論をまとめ →
6)レポート完成

ワークフロー vs マルチエージェント
並列化 vs 逐次処理
ワークフロー:1章ずつ順番に処理。次の章に進む前に前章の完成・反映を待つため、全体の所要時間は合計になる。
マルチエージェント:すべての章を同時に処理。章数が多いほど並列メリットが大きく、全体の所要時間は最長の1章分だけに近づく。
▶ 確認: レポート生成のスピードを最優先するか?
ユーザーの介入ポイント
ワークフロー:
計画案(章立て)フェーズで人のフィードバックを挟める
必要なら計画を練り直してから本文生成
マルチエージェント:
計画後は自動並列処理。途中で人が介入する仕組みは標準ではなし(要拡張)
▶ 確認: 中間確認や調整が必要か?
検索ツールの対応範囲
ワークフロー:Tavily、Perplexity、Exa、ArXiv、PubMed、Linkup…複数の API が選択可能
マルチエージェント:現状は Tavily のみ対応(将来的に拡張可能)
▶ 確認: 特定の検索 API で調査したい要件があるか?
制御と可視化のしやすさ
ワークフロー:各フェーズごとに状態が明確(計画案/フィードバック/各章の進捗)なので、何をやっているか追いやすい
マルチエージェント:背後で同時に走る処理が多いため、並列タスク管理の仕組みを理解しておく必要がある
▶ 確認: 進捗やログを逐一把握したいか?
向いているシナリオ
ワークフロー:
高い品質管理が必須で、人によるチェックポイントを設けたい場合
検索 API の選択肢が多い環境
自動化とスピードを最重視し、数分〜十数分で一気にレポートを欲しい場合
章ごとに独立した調査が可能で、交差検証が不要なケース
▶ 確認: プロジェクトの目的が「品質重視」か「スピード重視」か?

Open Deep Researchの利点
GeminiやOpenAIなどのリサーチアシスタントと比べて設定柔軟性、コスト効率、そして新しいモデルやツールを柔軟に組み込める利点がある。
- 柔軟な設定が可能:
- レポート構造を細かく指定可能
- 使用するLLMモデル(プランナー、ライター)やプロバイダーを自由に選択・変更可能
- Human in the loopの動作をカスタマイズ可能
- Deep Researchフェーズでの検索回数や反復回数を設定可能
- 使用する検索APIを自由に選択・変更可能(Tavily、Perplexity、SERP API、Firecrawlなど)