【MCPのトリセツ 資料】ウェブ情報を取得するMCPの比較 (Fetch、Firecrawl、Markdownify、Perplexity)
💡 MCPの始め方シリーズについて
Claude などの AI を強化する「MCP(Model Context Protocol)」の導入方法と活用テクニックのシリーズ。本記事では、ウェブコンテンツの取得や処理に関連する4つのMCPサーバー(Fetch、Firecrawl、Markdownify、Perplexity)の特徴と使い分けについて詳しく解説します。
シリーズ目次
- MCPの概要と導入方法
- Filesystem MCP Server: AIでローカルファイルを扱う
- YouTube MCPサーバー:動画の内容を取得
- mcp-pandoc: AIでドキュメント形式を変換
- GitHub MCPサーバー: AIでリポジトリを管理
- Figma MCP:デザインとコードを効率的に連携
- Slack MCPサーバー:チームコミュニケーションを強化
- Firecrawl MCP:スクレイピングでウェブ情報を取得・分析
- Markdownify MCP Server: WebページやPDFをMarkdown文書化
- Raindrop.io MCP Server: 便利なブックマークサービスをAIから使う
- Fetch MCP Server: ウェブコンテンツを取得・処理
- Blender MCP Server: 会話で Blender を操作し3Dモデルを作成
- Perplexity MCP Server: Perplexity ならではの検索をAIとの会話で実行
👉 このリファレンス: ウェブの情報を取得するMCPの使い分け (Fetch、Firecrawl、Markdownify、Perplexity)
📊 機能比較表
機能 | Fetch MCP | Firecrawl MCP | Markdownify MCP | Perplexity MCP |
---|---|---|---|---|
基本的なウェブページ取得 | ✅ シンプル | ✅ 高機能 | ✅ Markdown変換 | ✅ 検索ベース |
インストールの手軽さ | ✅ 非常に簡単 | ⚠️ やや複雑 | ⚠️ 依存関係あり | ✅ 簡単 |
メモリ使用量 | ✅ 軽量 | ⚠️ やや重い | ⚠️ 中程度 | ✅ 軽量 |
複数ページのクロール | ❌ 非対応 | ✅ 対応 | ❌ 非対応 | ❌ 直接的非対応 |
検索機能 | ❌ 非対応 | ✅ 対応 | ❌ 非対応 | ✅ 専門 |
ウェブページの分析 | ❌ 基本的な取得のみ | ✅ AI分析機能あり | ❌ 基本的な変換のみ | ✅ 高度な検索分析 |
スクリーンショット | ❌ 非対応 | ✅ 対応 | ❌ 非対応 | ❌ 非対応 |
Markdownに変換 | ✅ 基本的 | ✅ 高機能 | ✅ 専門 | ❌ 直接変換なし |
PDFから変換 | ❌ 非対応 | ❌ 非対応 | ✅ 対応 | ❌ 非対応 |
画像/オーディオから変換 | ❌ 非対応 | ❌ 非対応 | ✅ 対応 | ❌ 非対応 |
Officeファイルから変換 | ❌ 非対応 | ❌ 非対応 | ✅ 対応 | ❌ 非対応 |
YouTube字幕取得 | ❌ 非対応 | ✅ 対応 | ✅ 対応 | ❌ 非対応 |
ディープリサーチ | ❌ 非対応 | ▲ 浅く対応 | ❌ 非対応 | ✅ 専門 |
最新情報へのアクセス | ❌ 限定的 | ▲ 限定的 | ❌ 限定的 | ✅ 対応 |
🔍 ウェブコンテンツ関連の4つのMCPサーバー
Fetch MCP
Fetch MCP Serverは、Model Context Protocolの公式リファレンス実装の一つで、シンプルで軽量な設計が特徴です。単一ページの情報取得に特化しており、基本的なウェブコンテンツの取得と処理を効率的に行えます。
主な機能:
- ウェブページの内容をMarkdown形式で取得
- 長いウェブページを分割して読み込み(チャンク読み込み)
- 生のHTMLコンテンツの取得(オプション)
- 取得するコンテンツの長さ制限
Firecrawl MCP
Firecrawl MCP Serverは、複数ページのクロールや検索機能、高度な分析機能を備えた強力なMCPサーバーです。ウェブサイト全体をLLM用に変換するのに適しています。
主な機能:
- 複数ページのクロールと分析
- ウェブ検索と結果の分析
- スクリーンショットの取得
- ディープリサーチの実行
- YouTube字幕の取得
- AI分析機能
※ 真の Deep Research はまだ正式リリースはされていない (2025-03-11 現在)
Deep Research - Firecrawl
Markdownify MCP
Markdownify MCP Serverは、ウェブコンテンツだけでなく、様々なファイル形式をMarkdownに変換することに特化したMCPサーバーです。
主な機能:
- ウェブページをMarkdownに変換
- PDFをMarkdownに変換
- Office文書(DOCX、XLSX、PPTX)をMarkdownに変換
- 画像をMarkdownに変換(メタデータ付き)
- オーディオをMarkdownに変換(文字起こし付き)
- YouTube動画の字幕をMarkdownに変換
Perplexity MCP
Perplexity MCP Serverは、Perplexity AIのサーチエンジンを直接活用してウェブ情報を検索・取得するためのMCPサーバーです。最新情報へのアクセスと高度な検索機能が特徴です。
主な機能:
- Perplexity AIの検索エンジンを直接利用
- 最新のウェブ情報へのアクセス
- AIによる検索結果の要約と分析
- 会話形式での情報探索
- 複雑なリサーチクエリへの対応
- 多言語対応
🔄 おすすめの使い分け
- Fetch MCP: 単一ページの情報取得、軽量な環境での使用、シンプルな使い方を好む場合。公式リファレンス実装なので安定性が高い。
- Firecrawl MCP: 複数ページのクロール、検索機能、高度な分析、ディープリサーチが必要な場合。ウェブサイト全体をLLM用に変換するのに適している。
- Markdownify MCP: ウェブページやPDF、Officeファイル、画像、オーディオを構造化されたMarkdownに変換して保存したい場合。多様なファイル形式の変換に特化している。
- Perplexity MCP: 最新のウェブ情報への素早いアクセス、高度な検索機能、複雑なリサーチクエリが必要な場合。特に最新情報や時事問題の調査に適している。
📋 具体的なシナリオ別の使い分け
-
単純な情報参照: Fetch MCP
→ 特定のウェブページを素早く参照したい場合 -
複数ページの調査研究: Firecrawl MCP
→ トピックに関する広範な情報収集や分析が必要な場合 -
コンテンツの整理と保存: Markdownify MCP
→ ウェブページやドキュメントを構造化して保存したい場合 -
APIドキュメントの参照: Fetch MCP
→ 特定のAPIドキュメントを参照したい場合 -
ニュース記事の要約作成: Fetch MCP + Markdownify MCP
→ ニュース記事を取得して構造化した要約を作成したい場合 -
複数ソースの比較分析: Firecrawl MCP
→ 複数の情報ソースを比較して分析したい場合 -
PDFやOfficeファイルの変換: Markdownify MCP
→ 様々なファイル形式をMarkdownに変換したい場合 -
最新動向の調査: Perplexity MCP
→ 最新のニュースや時事問題について調査したい場合 -
トピックの深掘り: Perplexity MCP
→ 特定のトピックについて詳細に調査し、深く理解したい場合 -
複雑な質問への回答: Perplexity MCP
→ 複数の情報源からの情報を統合して回答が必要な複雑な質問に答える場合
これらのサーバーは相互に補完し合う関係にあり、状況に応じて適切なサーバーを選択することで、より効率的な情報収集と整理が可能になります。
🔄 組み合わせ活用例
Fetch MCP + Markdownify MCP
単一ページの情報取得と、その情報の構造化・保存を組み合わせることで、重要な情報を効率的に整理できます。
Firecrawl MCP + Markdownify MCP
複数ページから収集した情報を、Markdownifyを使って様々な形式で保存・整理することができます。
Perplexity MCP + Fetch MCP
Perplexity MCPで最適な情報源を見つけ、その特定のページをFetch MCPで詳細に取得することができます。
全てのMCPを状況に応じて使い分け
プロジェクトの性質や情報収集の目的に応じて、最適なMCPサーバーを選択することで、AIとの情報収集作業を最大限に効率化できます。
💬 Claude Desktopのカスタムインストラクション例
※現在試行錯誤中、アップデートする可能性が高いです。
Claude Desktopでウェブコンテンツ取得のMCPを使い分けるためのカスタムインストラクション(システムプロンプト)の例です。これをカスタムインストラクションに追加することで、Claudeはあなたの優先順位に従ってMCPサーバーを選択するようになります。
## ウェブコンテンツ取得のMCP使い分け
ウェブからの情報取得が必要な場合は、以下の優先順位で対応してください:
1. 基本的には「fetch」MCPを優先して使用してください。
- 単一ページの情報取得
- 軽量で高速な動作が必要な場合
- APIドキュメントの参照
2. 以下の場合のみ「perplexity-ask」MCPを確認の上使用してください:
- 最新の情報やニュースが必要な場合
- 特に時事問題や最新トレンドに関する調査
- 複雑なリサーチクエリがある場合
- 複数の情報源からの統合された情報が必要な場合
- ※ `Perplexityで` や `パープレで` と指示がある場合は確認不要
3. 以下の場合のみ「markdownify」MCPを使用してください:
- PDF、Office文書、画像、オーディオなどの変換が必要な場合
- コンテンツの高度な構造化と再構成が必要な場合
- YouTube字幕の取得が必要な場合
4. 以下の場合のみ「firecrawl-mcp」MCPを確認の上使用してください:
- 複数ページにまたがる情報収集が必要な場合
- ウェブサイト全体のクローリングが必要な場合
- 検索機能を使った情報の絞り込みが必要な場合
- ディープリサーチが必要な場合
- YouTube字幕の取得が必要な場合
- ※ `Firecrawlで` と指示がある場合は確認不要
特に指示がない限り、常に「fetch」MCP を最初に試してください。他のMCPは、fetch MCPで対応できない特殊なケースでのみ使用してください。特に「firecrawl-mcp」と「perplexity-ask」は実行前に使用するかユーザーに確認してください。
このカスタムインストラクションを追加することで、Claudeはウェブコンテンツの取得時に基本的にはFetch MCPを優先して使うようになります。そして、特定の機能が必要な場合にのみ、他の3つのMCPサーバーを使い分けるようになります。
Discussion