🦜

Langchain公式の Open Deep Research を触ってみる

2025/02/26に公開

はじめに

Deep Researchとは

Deep ResearchはWeb検索を使って詳細なレポートを出力してくれるエージェント型のAIワークフローです。OpenAIのo1やo3に依頼した場合よりも多くの検索結果を元にレポートを作成してくれます。ただしその分、実行にかかる時間は多くなります。

最近はOpenAIやGoogleのGeminiなどから各社のDeep Researchが利用できるようになっています。このような中、LangChainがDeep Researchのオープンソース版であるOpen Deep ResearchをGithub上で公開しました。
https://github.com/langchain-ai/open_deep_research

※ OpenAIなどのDeep Researchとは異なる実装であることに注意してください。

Open Deep ResearchのワークフローはLangGraphで構築されており、LangGraph Studio上でグラフを可視化・実行ができます。
今回はこれを動かしていきます。

Open Deep Researchの概要

Open Deep Researchの主要なモジュールは以下の通りです。
プランナーが最初にユーザーからの入力に応じて、レポートの構造(複数のセクションに分かれる)を決定し、検索モジュールが指定された検索APIを利用して情報を収集します。その後、ライターが収集した情報を元に執筆を行い、反復プロセスを通じてこれを改善し精度を向上させます。全てのセクションが完成したら、最終レポートとして統合・生成されます。

  • プランナー(Planner): ユーザーからのクエリを受け取り、リサーチの全体計画を策定します。
  • 検索モジュール: プランナーが作成した計画に基づき、指定された検索API(例:Tavily、Perplexity)を使用して関連情報をウェブ上から収集します。
  • ライター(Writer): 収集した情報をもとに、各セクションの内容を執筆します。

report-generation-flow

必要なセットアップ

Githubからクローン

まずはじめにGithubからレポジトリをクローンしましょう。

git clone https://github.com/langchain-ai/open_deep_research.git

クローンが完了したらプロジェクトの構成を確認してみます。

cd open_deep_research
tree .

依存関係のインストール

pyproject.tomlファイルが存在するので、こちらから依存パッケージをインストールします。
今回は uv を使っています。uv自体のインストール方法はこちらを参考にしてください。

uv sync

環境変数の設定

クローンしたリポジトリ配下に .env.exampleというファイルが置かれています。
こちらを元に.envファイルを用意します。

cp .env.example .env
.env
OPENAI_API_KEY=sk-xxx
ANTHROPIC_API_KEY=sk-xxx
TAVILY_API_KEY=xxx
GROQ_API_KEY=xxx
PERPLEXITY_API_KEY=xxx

APIキーの設定

各サービスのAPIキーを取得しこちらに記入してください。
以下の3点があればデフォルトのconfigurationで正常に動作します。

  • OPENAI_API_KEY
  • ANTHROPIC_API_KEY
  • TAVILY_API_KEY

設定 configuration.pyを確認する

利用する言語モデルや検索サービスの設定はconfiguration.pyから行えるようになっています。
もし設定されているモデルがAPIから使えない場合は、他のモデルやプロバイダーを利用するように記述を変更しましょう。

https://github.com/langchain-ai/open_deep_research/blob/main/src/open_deep_research/configuration.py#L35-L45

LangGraph CLI のインストール

LangGraphのグラフを実行するサーバーを起動するためには LangGraph CLIが必要です。
uvを利用している場合は以下のコマンドでインストールします。

uv pip install -U "langgraph-cli[inmem]"

実際に動かしてみる

以下のコマンドでサーバーが起動できたら、ポート番号を確認します

uv run langgraph dev

http://127.0.0.1:2024でサーバーが起動した

LangSmith / LangGraph Studio上でグラフの確認

起動したサーバーに対して、LangGraph Studioからアクセスします。

LangGraph Studioはデスクトップ版とブラウザ版がありますが、ブラウザ版はLangSmithにログインすることで利用できるためこちらを利用することにします。
ChromeじゃないとStudioが正常に動かなったのでChromeからLangSmithにアクセスしましょう。

Dashboardにログインできたら横のサイドバーから LangGraph Platformボタンを押します。

右上の[Open Studio]からhttp://127.0.0.1:2024に接続します。

すると、今回のOpen Deep Researchのワークフローがグラフとして表示されているのが確認できます。

入力してみる

Deep Researchについてのレポートの作成を依頼してみました。

最近話題のDeep Researchについて詳しく調査してください。
最終的なレポートは日本語で作成してください。

実行中のノードがハイライトされるのも面白いです😁

結果

レポート

Deep Researchに関するレポート

本レポートでは、OpenAIやGoogleのGeminiが発表しているDeep Research機能について詳しく調査し、その背景や重要性を探ります。Deep Researchは、情報収集と分析を自動化する革新的なツールであり、特にビジネスや学術研究において効率を大幅に向上させる可能性を秘めています。これにより、従来のリサーチ手法に比べて、迅速かつ高精度なレポート作成が可能となります。

概要と比較

Deep Research機能は、OpenAIのChatGPTとGoogleのGeminiの両方で提供されており、それぞれ異なる強みを持っています。以下の表は、両者の特徴を比較したものです。

特徴 Gemini Deep Research ChatGPT Deep Research
情報収集の速度 数分で完了 5〜30分程度
出典の明示 明確に示される 詳細な出典リストを提供
分析の深さ 主に情報の整理と要約 深い分析と推論が可能
主な活用シーン マーケティング調査、競合分析 学術研究、専門的なデータ分析

今後、Deep Researchの機能はさらに拡充されることが期待されますが、情報の信頼性やプライバシーの懸念といった課題にも対処する必要があります。これらの点を考慮しつつ、AI技術の進化を見守ることが重要です。

OpenAIのDeep Research機能の全体像

OpenAIのDeep Researchは、複雑なリサーチタスクを自動化し、専門家レベルのレポートを迅速に生成する革新的なAIエージェントです。 この機能は、ユーザーが入力したクエリに基づき、数百のオンラインソースを検索・分析し、情報を統合してレポートを作成します。従来の手法では数時間かかる調査を、5分から30分で完了させることが可能です。

Deep Researchは、OpenAIの最新モデル「o3」を基盤としており、ウェブ検索、PDF、画像解析など多様なデータソースに対応しています。生成されるレポートには、情報の出典が明示され、ユーザーは結果の信頼性を確認できます。特に、Humanity's Last Examで26.6%の精度を達成し、GAIAベンチマークでも高いスコアを記録しています。

この機能は現在、ChatGPT Proプラン(月額200ドル)で利用可能で、将来的には他のプランへの拡大も予定されています。

Sources

Deep Researchに搭載された技術の詳細

Deep Researchは、AIによる高度な情報収集と分析を実現する革新的なツールです。 このシステムは、Webブラウジング、Python分析、強化学習などの技術を駆使して、ユーザーの要求に応じたリサーチを自動化します。

主な機能は以下の通りです:

  • Webブラウジング: AIがインターネット上の数百の情報源を自動的に検索し、関連情報を収集します。
  • Python分析: 内蔵のPythonツールを使用して、データの統計解析やグラフ生成を迅速に行います。
  • 強化学習: AIは過去のデータを基に学習し、次回の検索クエリを動的に調整する能力を持っています。

具体的な活用例として、金融市場の動向分析や競合企業の調査が挙げられます。これにより、従来のリサーチ手法に比べて、時間と労力を大幅に削減することが可能です。

Sources

ユーザーがDeep Research機能を利用する方法

Deep Researchは、複雑なリサーチタスクを迅速に処理する強力なツールです。 ユーザーは、まずGeminiのモデルドロップダウンから「Gemini 1.5 Pro with Deep Research」を選択し、調査したいテーマや具体的な要件をプロンプトとして入力します。例えば、「アメリカのAIスタートアップ動向について、投資額や注目ベンチャーの事業内容を深掘りしてレポートを作成してほしい」といった具体的な指示が有効です。

次に、Deep Researchは自動的にリサーチプランを生成し、ユーザーはその内容を確認・編集できます。リサーチを開始すると、数分から最大30分の間に、Geminiが数百のウェブサイトを分析し、詳細なレポートを作成します。生成されたレポートには、出典リンクが明示されており、Googleドキュメントにエクスポートすることも可能です。

Sources

Deep Researchのビジネスおよび学術研究への活用

Deep Researchは、情報収集の効率を大幅に向上させるツールです。 GoogleのGeminiやOpenAIのChatGPTが提供するこの機能は、特にビジネスや学術研究において多くの利点をもたらします。例えば、Gemini Deep Researchは70以上のウェブサイトを自動で分析し、整理されたレポートを生成します。これにより、企業は市場調査や競合分析を迅速に行うことが可能です。

具体的な活用例として、マーケティング担当者が新製品の市場動向を調査する際に、Deep Researchを利用することで、競合他社の戦略や消費者のニーズを短時間で把握できます。また、学術研究者は、論文執筆のために必要な情報を効率的に収集し、信頼性の高いデータを基にした分析を行うことができます。

Sources

GoogleのGemini Deep Researchとの比較

GoogleのGemini Deep Researchは、迅速な情報収集と整理に優れたツールである。 Geminiは、数百のウェブサイトから情報を自動的に収集し、出典を明示したレポートを生成する機能を持つ。特に、Googleの検索エンジンを活用することで、最新の情報を迅速に取得できる点が強みである。

一方、OpenAIのChatGPT Deep Researchは、より深い分析と推論を行う能力に優れている。ユーザーが入力したプロンプトに基づき、複数の情報源から得たデータを統合し、専門的なリサーチを自動化する。これにより、数時間かかる調査を数十分で完了させることが可能である。

特徴 Gemini Deep Research ChatGPT Deep Research
情報収集の速度 数分で完了 5〜30分程度
出典の明示 明確に示される 詳細な出典リストを提供
分析の深さ 主に情報の整理と要約 深い分析と推論が可能
主な活用シーン マーケティング調査、競合分析 学術研究、専門的なデータ分析

Geminiは特にビジネス用途に適しており、ChatGPTは学術的な調査に向いている。

Sources

Deep Researchの今後の発展可能性と課題

Deep Researchは、情報収集と分析の効率を大幅に向上させる可能性を秘めています。 OpenAIの最新モデル「o3」を基盤にしたこのツールは、ユーザーの指示に基づき、数百のオンラインソースを自動的に検索し、専門家レベルのレポートを生成します。これにより、従来のリサーチ手法に比べて、数時間かかる作業を数十分で完了させることが可能です。

しかし、技術的な限界や倫理的な問題も存在します。具体的には、以下の課題が挙げられます。

  • 情報の信頼性: AIが収集した情報の中には、誤情報や偏ったデータが含まれる可能性があります。
  • プライバシーの懸念: ユーザーのデータがどのように利用されるかについての透明性が求められます。
  • 依存リスク: ユーザーがAIの出力に過度に依存することで、判断力が低下する恐れがあります。

これらの課題に対処しつつ、Deep Researchの機能をさらに拡充することが、今後の重要な課題となるでしょう。

Sources

Deep Researchに関する調査レポート

本レポートでは、OpenAIやGoogleのGeminiが提供するDeep Research機能について詳しく調査しました。これらのAIツールは、情報収集や分析の効率を大幅に向上させることを目的としており、特にビジネスや学術研究において重要な役割を果たしています。各機能の特徴や技術的背景、利用方法、実際の活用事例を通じて、今後の展望や課題についても考察しました。

主要な知見と今後の展望

本レポートの主要な知見を以下にまとめます。

特徴 Gemini Deep Research ChatGPT Deep Research
情報収集の速度 数分で完了 5〜30分程度
出典の明示 明確に示される 詳細な出典リストを提供
分析の深さ 主に情報の整理と要約 深い分析と推論が可能
主な活用シーン マーケティング調査、競合分析 学術研究、専門的なデータ分析

今後、Deep Research機能は情報収集の効率をさらに向上させる可能性がありますが、情報の信頼性やプライバシーの懸念、ユーザーの依存リスクといった課題にも対処する必要があります。これらの課題を克服することで、より信頼性の高いリサーチツールとしての発展が期待されます。

最後に

本記事では、実際にOpen Deep Researchを動かしてみました。LangGraph Studioを活用したワークフローの可視化や、エージェントによるリサーチの流れを体験することで、Deep Researchがどのように動作するのかを理解できたのではないでしょうか。

今後も、Deep ResearchのみならずAIエージェントの発展とその可能性を注視しながら、AIの進化を追い続けていきたいと思います。

最後までお読みいただき、ありがとうございました!

Discussion