🤖

【DeepResearch × スライド生成】長すぎるAIレポートをスライド生成AIで要約・図解させて楽をする

に公開

TL;DR

DeepResearchの出力が長すぎるので、4つのスライド生成AIに要約・可視化させてみた

私たちの研究室(NISLab)

https://nisk.doshisha.ac.jp/

アドベントカレンダー 4日目~

https://nislab-advendcallender-2025-1cyt.vercel.app/

DeepResearchとは?

ご存知の方も多いと思いますが,DeepResearchはChatGPTが「数百のオンライン情報源を検索し,分析し,統合してリサーチアナリスト級のレポートを作成する」エージェント機能です.
これを用いることで,人間が数時間かかる複雑な調査を,数十分でレポートを作成してくれます.
(OpenAIの説明文を参考)
https://openai.com/ja-JP/index/introducing-deep-research/
ChatGPT以外にも,GeminiやClaudeなどでも使える機能であり,とても強力なツールです.
最近では,Googleが提供するNotebookLMでも自分が選択したソースから検索するRAG的に使えるDeepResearchが登場して,少し話題になりました.

DeepResearchの出力が長すぎる

DeepResearchはとても強力なツールであり,検索を自動で実施してくれるのでとても便利なのですが,検索結果として出力されるレポートの文章が長すぎる!
ただ長すぎるだけでなく,図表やイラストが一切ないため,僕は検索したけど結局あまり読まないみたいなことが多々あります.
そこで,このDeepResearchの長文を読むのではなく,スライドを生成するAIを使うことで楽をしようということです.
この記事では,いろいろなスライド生成AIを試してみたので,DeepResearchの長文を読むのが面倒だと感じた際には,ぜひ使ってみてください!

今回DeepResearchで調べたこと

今回は,AIの発展によって複雑化されつつある,AIコーディングエージェントについてそれぞれのエージェントがどのような機能があり,メリット・デメリットについてGeminiのDeepResearchを使って調べてみました.
ちなみにGeminiを使った理由は,GeminiのDeepResearchの回数制限が緩いからです!
調べた感じchatGPTは使用制限がplusプランで1ヶ月に25回まで.それに比べて,geminiはproプランで1日に最大20回(どちらのプランも1ヶ月20ドル)
回数制限はこの辺りを参照
https://support.google.com/gemini/answer/16275805?hl=ja-JP

検索で使用したプロンプト

主要なAIコーディングエージェントについて、それぞれの機能・特徴・メリット・デメリットを詳しく調べてください。

DeepResearchの結果

一応,DeepResearchで検索した結果を載せておきます.

検索結果
2025年 AIコーディングエージェント市場における技術的特異点と機能比較に関する包括的調査報告書
1. エグゼクティブサマリー:コパイロットから自律型エージェントへの不可逆的移行
2024年から2025年にかけてのソフトウェア開発ツールの進化は、単なる生産性向上ツールの枠を超え、エンジニアリングプロセスの構造的変革をもたらしている。かつて「GitHub Copilot」の登場によって定義された「AIによるコード補完(Autocomplete)」の時代は終わりを告げ、現在は「AIコーディングエージェント」による「自律的タスク実行(Autonomous Task Execution)」の時代へと移行した。この変化の本質は、AIが開発者の入力を受動的に待つ存在から、開発者の意図(Intent)を汲み取り、ファイルシステムの走査、ターミナルコマンドの実行、エラーの修正、そしてドキュメントの参照といった一連のエンジニアリングタスクを能動的かつ複合的に実行する主体へと進化した点にある 1。
本報告書では、急速に分化・発展するAIコーディングエージェント市場を、「AIネイティブIDE(Cursor, Windsurf)」、「プラットフォーム拡張型(GitHub Copilot, Amazon Q Developer)」、「ブラウザ完結型プロトタイピング(Bolt.new)」、そして**「完全自律型エンジニア(Devin)」**の4つの主要カテゴリに分類し、それぞれの技術的アーキテクチャ、機能的優位性、導入リスク、および経済的側面を包括的に分析する。
特に、2025年の市場を決定づけているのは「コンテキスト認識(Context Awareness)」の深化である。大規模言語モデル(LLM)のコンテキストウィンドウの拡大と、RAG(検索拡張生成)技術の高度化により、AIは単一のファイルだけでなく、リポジトリ全体、あるいは関連する外部ドキュメントや依存ライブラリの仕様までを視野に入れた提案が可能となった。この技術的進歩は、開発者に対し、従来の「コードを書く」という作業から、「AIの出力をレビューし、オーケストレーションする」という上位レイヤーへの役割転換を迫っている。
また、本報告書では、各ツールの表面的な機能比較にとどまらず、企業のセキュリティポリシーとの整合性、トークン課金モデルがもたらす経済的影響、そして開発者の「フロー状態(Flow State)」に与える認知心理学的な影響についても深く掘り下げる。Cursorの「Shadow Workspace」技術や、Windsurfの「Cascade」アーキテクチャといった独自技術が、いかにして開発体験の質的向上を実現しているか、そのメカニズムを解明する。
2. 技術的背景:AIコーディングエージェントを支えるコア技術
各エージェントの詳細な分析に入る前に、現代のAIコーディングツールを支える共通の技術基盤と、それらが直面している課題について定義する。これにより、後述する各ツールの強みと弱みが、どの技術的トレードオフに起因するものであるかを理解する助けとなる。
2.1 大規模言語モデル(LLM)と推論能力の特化
2025年のコーディングエージェントは、もはや単一の汎用モデル(例:GPT-4)のみに依存していない。多くのツールが、タスクの性質に応じてモデルを動的に切り替える「マルチモデル戦略」または「ルーターアーキテクチャ」を採用している。
• 推論(Reasoning)モデル: 複雑なリファクタリングやアーキテクチャ設計には、OpenAIの o1 や o3、Anthropicの Claude 3.5/3.7 Sonnet といった、高い論理的推論能力を持つモデルが使用される。これらは応答速度よりも精度の高さが優先される 1。
• 速度重視(Instant)モデル: ユーザーのタイピングに追従するリアルタイム補完(Tab補完)には、パラメータ数を絞り、レイテンシを極限まで低減した軽量モデル(例:Windsurfの SWE-1-mini や Mistral ベースのカスタムモデル)が採用されている 4。
• ドメイン特化モデル: Windsurfの SWE-1 のように、ソフトウェアエンジニアリング特有のタスク(リントエラーの修正、ファイルパスの解決など)に特化してファインチューニングされた独自モデルが登場し、汎用モデルでは解決できない微細な文脈理解を実現している 6。
2.2 RAGとコンテキスト管理の高度化
「AIがプロジェクト全体を理解していない」という「コンテキストの盲目(Context Blindness)」は、長らくAIコーディングの課題であった。これを解決するために、各社は高度なRAG(Retrieval-Augmented Generation)システムを実装している。
• インデックス化(Indexing): プロジェクト内の全ファイルをベクトル化し、ローカルまたはクラウド上のデータベースに格納する技術。これにより、ユーザーの質問に関連するコード断片を瞬時に検索し、LLMのプロンプトに注入することが可能になる。
• リランキングとフィルタリング: 単に関連度が高いだけでなく、依存関係グラフや呼び出し履歴(Call Graph)に基づいて、真に必要な情報のみを選別するアルゴリズムが、回答の精度(幻覚の抑制)を左右する重要な差別化要因となっている 7。
2.3 エージェント的自律性とツール使用(Tool Use)
最新のエージェントは、コードを生成するだけでなく、IDEのAPIを通じて「行動」する能力を持つ。
• ファイル操作: 複数のファイルを同時に作成・編集・削除する。
• ターミナル操作: コマンドを実行し、その出力(エラーログ等)を読み取って次のアクションを決定する。
• ブラウザ操作: ドキュメントを検索したり、プレビュー画面を確認したりする。
この「Read-Think-Act-Observe」のループ(ReActプロンプティング等の応用)が、自律型エージェントの核心的な動作原理である。
3. Cursor:AIネイティブIDEの先駆者とその深層分析
Cursorは、MicrosoftのVS Codeをフォークし、そのUI/UXをAIとの協働に最適化する形で再設計された「AIファースト」のエディタである。2025年現在、プロフェッショナルな開発者層から最も熱烈な支持を集めるツールの一つとしての地位を確立している。
3.1 技術アーキテクチャ:Shadow Workspaceとハイブリッド推論
Cursorの最大の特徴は、「Shadow Workspace(影のワークスペース)」と呼ばれる概念にある。これは、バックグラウンドでユーザーのコードベースのコピー(または高度なインデックス)を保持し、メインのエディタをブロックすることなく、AIが自由にコードの探索や実験を行える仮想的なサンドボックス環境を指す 9。
3.1.1 Composer機能とマルチファイル編集の革新
「Composer」は、Cursorの機能を象徴する強力なインターフェースである。従来のチャットボットが「提案されたコードをコピー&ペーストする」スタイルであったのに対し、Composerは「プロジェクト全体に対して変更を直接適用する」スタイルをとる 1。
• Agentモード: ユーザーが「認証機能をAuth0からSupabaseに移行して」といった抽象度の高い指示を与えると、Composerは関連するすべてのファイル(APIルート、ミドルウェア、フロントエンドコンポーネント、設定ファイル)を特定し、それぞれの変更案を生成する。
• 並列処理: 複数のファイルの変更案を並列に生成し、ユーザーはそれらをファイル単位または一括で「Accept(適用)」または「Reject(拒否)」できる。このUIは、コードレビュー(PRレビュー)の体験に近く、AIを「部下」として扱う感覚を強化する 3。
3.1.2 Tab(Copilot++)による予測的コーディング
Cursorの「Tab」機能は、単純な次トークン予測ではない。カーソルの移動履歴や直前の編集内容(Diff)を分析し、「ユーザーが次に修正しようとしている場所」とその「修正内容」を同時に予測する。
例えば、関数名を変更した直後に、その関数を呼び出している別の箇所の修正を提案するなど、論理的な一貫性を保つためのリファクタリング提案をリアルタイムに行う。これにより、開発者はTabキーを押すだけで、複数の修正を連鎖的に完了させることができる 1。
3.2 コンテキスト制御と .cursorrules
Cursorが上級者に好まれる理由の一つは、AIに与えるコンテキストを極めて細かく制御できる点にある。
• 明示的な参照シンボル: @Codebase(全ファイル検索)、@Files(特定ファイル指定)、@Web(Web検索)、@Docs(ドキュメント参照)といったシンボルを用いることで、ユーザーはAIの探索範囲を厳密に定義できる。これは、大規模なモノレポ(Monorepo)において、関係のないモジュールの情報を読み込ませないために不可欠な機能である 10。
• .cursorrules による統制: プロジェクトのルートに .cursorrules ファイルを配置することで、AIに対するシステムプロンプトをプロジェクト単位で固定できる。例えば、「TypeScriptの型定義は必ず types.ts に集約すること」「UIライブラリはShadcn UIを使用すること」「日本語で回答すること」といったルールを記述しておけば、チーム全員が同じ基準でAIの支援を受けられる。これは、コード品質の均質化を目指すテックリードにとって強力なガバナンスツールとなる 3。
3.3 価格モデルと経済性
• Proプラン ($20/月): 月間500回の「高速プレミアムリクエスト(GPT-4o, Claude 3.5 Sonnet等)」と、無制限の「低速プレミアムリクエスト」、無制限のコード補完(cursor-smallモデル)が含まれる。
• コストの課題: Composer機能は大量のトークンを消費するため、複雑なタスクを繰り返すと、500回の高速枠は容易に枯渇する。枠を超過すると応答速度が低下するか、別途課金が必要になる場合がある。また、企業向けプラン(Enterprise)では、SSOや集中請求管理が提供されるが、価格はユーザーあたり月額40ドルと高額になる傾向がある 1。
3.4 セキュリティとプライバシー
Cursorはクラウドベースの処理を行うため、セキュリティへの懸念は常に存在する。これに対し、Cursorは「Privacy Mode」を提供しており、このモードを有効にすると、ユーザーのコードはサーバーに一切保存されず(Zero Data Retention)、モデルの学習にも使用されないことが保証される 11。
しかし、インデックス化のためにコード断片が一時的にサーバーへ送信されるプロセスは避けられないため、完全なオフライン環境(エアギャップ環境)を求める防衛産業や金融機関にとっては、導入のハードルとなる場合がある 12。
3.5 総評:メリットとデメリットメリットデメリット圧倒的なカスタマイズ性: .cursorrulesによるプロジェクトごとのAI挙動定義が可能。学習曲線: 機能を最大限活用するには、適切なプロンプトエンジニアリングや@コマンドの習熟が必要。マルチファイル編集能力: Composer機能により、大規模なリファクタリングが容易。動作の重さ: Electronベースであり、大量のインデックス処理が走るとメモリ消費が増大する。モデル選択の自由: Claude, GPT, Geminiなどの最新モデルを即座に利用可能。インデックスの手動管理: 自動更新が遅れる場合があり、手動で再インデックスが必要な場面がある。
4. Windsurf:フロー状態を追求する「エージェントIDE」
Codeium社が開発したWindsurfは、Cursorと類似した「VS Codeフォーク」のアプローチを取りつつも、その設計思想において明確な差別化を図っている。Cursorが「多機能なツールボックス」であるなら、Windsurfは「空気を読むパートナー」を目指していると言える。
4.1 技術アーキテクチャ:CascadeとFlow Awareness
Windsurfの中核をなすのは「Cascade(カスケード)」と呼ばれるエージェントシステムである。Cascadeは、単なるチャットウィンドウではなく、IDE全体の状態機械として機能する。
• Flow Awareness(フロー認識): Cascadeは、ユーザーが開いているファイル、カーソルの位置、最近実行したコマンド、編集履歴、そしてクリップボードの内容などを常時監視している。これにより、ユーザーが明示的にコンテキストを与えなくても、「今、ユーザーが何をしようとしているか」を深く推論する 6。
• ディープコンテキスト: Windsurfは「変数追跡」や「定義へのジャンプ」といった静的解析ツールの情報をAIのコンテキストに統合しているため、コードの依存関係を理解する深度が深いとされる。これにより、変数の型定義が変わった際に、その影響範囲を正確に特定するといったタスクにおいて高い精度を発揮する 7。
4.2 独自モデル「SWE-1」とCerebrasによる高速化
汎用LLMに依存する競合に対し、Windsurfは自社開発のソフトウェアエンジニアリング特化モデル「SWE-1」ファミリーを展開している。
• SWE-1: ツール使用(Tool Use)能力に長けたモデルで、リントエラーの修正や複雑なファイル操作において、Claude 3.5 Sonnetと同等以上の性能を発揮しつつ、低コストでの運用を可能にしている。
• 超低レイテンシ推論: AIハードウェア企業のCerebras社との提携により、専用チップを用いた超高速推論を実現している。これにより、AIの応答待ち時間を極限まで短縮し、開発者の思考を中断させない「フロー状態」の維持に貢献している 4。
4.3 ユーザー体験(UX)の特異性
WindsurfのUXは、AIとの対話を「チャット」ではなく「共同作業」として再定義している。
• Next Edit Suggestion (Tab-Tab-Tab): チャットで生成されたコードを適用する際、Windsurfは次々と修正箇所へカーソルを飛ばし、タブキーを押すだけで変更を確定していくインターフェースを提供する。これはマウスクリックを最小限に抑え、キーボードから手を離さずに作業を完結させるための工夫である 13。
• ターミナル統合: Cascadeはターミナル出力を直接読み取り、エラーが発生した際には即座に修正案を提示するボタンを表示する。これにより、エラーログをコピーしてチャットに貼り付けるという手作業が不要になる。
4.4 経済性と導入障壁
• 価格: Proプランは月額15ドル(年払い時)または月額15ドル(月払い)と、Cursorよりも割安な設定となっている。無料プランでも機能制限が比較的緩やかであり、個人開発者が試しやすくなっている 3。
• 安定性の課題: Reddit等のコミュニティでは、Windsurfの急速な機能追加に伴うバグ(フォルダスキャンの失敗、無限ロード、UIのフリーズ)が報告されており、安定性の面ではCursorに一日の長があるという評価も見られる 16。
4.5 総評:メリットとデメリットメリットデメリット超高速レスポンス: SWE-1モデルと専用ハードウェアによる低レイテンシ。過剰な自律性: AIが勝手にコンテキストを判断するため、意図しないファイルを参照する場合がある。コンテキスト自動認識: 明示的な指示なしでも状況を理解する能力が高い。安定性: 新機能の実装ペースが速く、バグや動作不安定な挙動が散見される。コストパフォーマンス: 競合他社より安価な価格設定。カスタマイズ性の低さ: Cursorの.cursorrulesに相当するような、詳細な挙動制御機能が弱い。
5. GitHub Copilot:巨大エコシステムの覇者
Microsoft傘下のGitHubが提供するCopilotは、市場シェアNo.1の地位を維持しつつ、エンタープライズ市場のニーズに応える形で進化を続けている。
5.1 エコシステム統合と「プラットフォーム」としての強み
Copilotの最大の武器は、世界中のソースコードが集まるGitHubそのものとの統合である。
• 開発ライフサイクル全般への介入: IDEでのコーディング支援だけでなく、GitHub.com上でのプルリクエストの要約生成、Issueのトリアージ、コードレビューの自動化、さらには脆弱性スキャン(GitHub Advanced Security)との連携まで、SDLC(ソフトウェア開発ライフサイクル)のあらゆるフェーズにAIが組み込まれている 1。
• Copilot Workspace: Issueに記述された自然言語の要件から、仕様策定、実装計画、コーディング、ビルド、テストまでをクラウド上のコンテナ環境で一気通貫に行う機能。これは「開発環境の構築」という障壁を取り払い、タスク着手までの時間を劇的に短縮する 3。
5.2 マルチモデル戦略への転換
当初はOpenAIのモデル(GPTシリーズ)のみを提供していたが、2024年以降、Copilotは「マルチモデル」戦略へと大きく舵を切った。ユーザー(特にPro+プランやEnterpriseユーザー)は、AnthropicのClaude 3.5 Sonnetや、GoogleのGemini 1.5 Proといった他社のトップモデルを、Copilotのインターフェースから選択して利用できるようになった。これにより、「推論にはClaude、速度にはGemini」といったモデルごとの強みを活かした使い分けが可能となり、ベンダーロックインのリスクを軽減している 3。
5.3 エンタープライズ機能とセキュリティ
大企業にとってCopilotが第一選択肢となる理由は、その強固なセキュリティとコンプライアンス対応にある。
• IP補償(Indemnification): 生成されたコードが著作権侵害で訴えられた場合、Microsoftが法的な保護を提供するプログラムがある。
• 学習データ利用の排除: BusinessおよびEnterpriseプランでは、ユーザーのコードがモデルの再学習に利用されないことが契約で明記されており、知財保護の観点から安心感が高い。
5.4 弱点と課題
一方で、IDEとしての体験においては、CursorやWindsurfのような「AIネイティブ」なツールに比べて制約が多い。CopilotはあくまでVS Codeの「拡張機能」として動作するため、エディタのUI(ファイルツリーやDiff表示など)を根本的に改変することが難しく、UXの統合度において一歩劣る側面がある。また、インデックス化の深さや速度においても、ローカル特化型の競合ツールに見劣りする場合がある 3。
6. Amazon Q Developer:AWS特化型のインフラ構築参謀
Amazon Web Services (AWS) が提供するAmazon Q Developer(旧CodeWhisperer)は、汎用的なコーディング支援に加え、AWSという複雑怪奇なクラウドインフラを攻略するための専用ツールとしての性格を強く持つ。
6.1 AWSインフラストラクチャへの特化
Amazon Qの真価は、通常のアプリケーションコードよりも、インフラストラクチャ・アズ・コード(IaC)やAWS SDKを利用するコードの生成において発揮される。
• IaCの生成: CloudFormation、Terraform、AWS CDKといった記述量の多い設定ファイルを、ベストプラクティスに基づいて生成する能力が高い。
• コンソール統合: AWSマネジメントコンソール上でエラーが発生した際、その場でQに質問すれば、ログ(CloudWatch Logs)を分析し、IAM権限不足やネットワーク設定ミスといった原因を特定・解説してくれる。これは運用保守(Ops)フェーズにおいて極めて有用である 2。
6.2 CLIエージェントとマイグレーション機能
• CLI統合: Amazon Qはターミナル(zsh, bash等)に統合され、自然言語でのコマンド入力をサポートする。「S3バケットの一覧をJSONで出して」と入力すれば、適切なAWS CLIコマンドを補完・実行する。
• Amazon Q Code Transformation: Java等の言語バージョンのアップグレード(例:Java 8から17へ)を自動化する機能。依存ライブラリの更新、非推奨APIの書き換えなどを一括で行い、大規模なレガシーシステムのモダナイゼーションを支援する。これは他社にはないユニークな機能である 21。
6.3 評価の二面性
AWSユーザーにとっては必須級のツールである一方、汎用的なWeb開発(ReactやVueなどのフロントエンド開発)においては、CopilotやCursorに比べて提案精度やUXの洗練度が低いという評価が一般的である。また、Reddit等のコミュニティでは、Qの回答が「ドキュメントの棒読み」であったり、「存在しないAPIをでっち上げる(ハルシネーション)」頻度が他ツールより高いという厳しい意見も散見される 22。
7. Bolt.new:ブラウザ完結型開発とプロトタイピング革命
StackBlitz社が開発したBolt.newは、ローカル環境構築という「開発の最初の壁」を完全に取り払ったツールである。
7.1 WebContainers技術とブラウザ内フルスタック開発
Bolt.newの革新性は、WebContainers技術にある。これは、ブラウザ(Chrome等)の中でNode.jsランタイムを直接動作させる技術である。これにより、サーバーサイドの処理を含むフルスタックアプリケーションを、クラウド上のVMではなく、ユーザーのブラウザ内で実行できる。
ユーザーが「ブログアプリを作って」とプロンプトを入力すると、AIはファイル構造を生成し、npm install でパッケージをインストールし、開発サーバーを起動し、プレビューを表示する。これら全てがブラウザのタブ内で完結し、外部へのデプロイ(Netlify等)もワンクリックで行える 2。
7.2 トークンエコノミクスの罠
Bolt.newはプロトタイピングには最強のツールだが、本格的な開発には経済的な課題がある。
• コンテキストの肥大化: プロジェクト内のファイルが増えると、AIに読み込ませるコンテキスト量が増大する。Bolt.newは各インタラクションで大量のトークンを消費するため、無料プラン(1日約15万トークン)は数回の修正指示ですぐに上限に達する。
• コストの壁: 有料プラン(Pro: 月額20ドル程度で1000万トークン)であっても、大規模な修正を行うとすぐにトークンが枯渇するという報告が多い。「1回の修正指示で100万トークンを消費した」という事例もあり、複雑なアプリを維持管理するには高コストになりがちである 25。
7.3 v0との比較
類似ツールであるVercelの v0 は、React/TailwindのUI生成に特化しており、バックエンドロジックを含まない「デザインカンプ」的なコード生成において圧倒的な品質を誇る。対してBolt.newは、データベース接続やAPIルートを含む「動くアプリ全体」を作る点に強みがある。UIの美しさならv0、機能的なプロトタイプならBolt.newという使い分けが定着している 28。
8. Devin:完全自律型エンジニアの理想と現実
Cognition社のDevinは、「人間を補佐するツール」ではなく「人間を代替するエンジニア」として登場し、業界に衝撃を与えた。
8.1 自律性のレベルと機能
Devinは、JiraやLinearのチケットを与えられると、自律的に以下のプロセスを実行する。
1. リポジトリの探索と理解。
2. 実行計画の立案。
3. コードの修正。
4. テストの実行とデバッグ(エラーが出たら自己修正)。
5. プルリクエストの作成。
このプロセスには数十分から数時間を要するが、その間、人間のエンジニアは別の作業を行うことができる 29。
8.2 価格とアクセシビリティ
• 高額なコスト: Devinのチームプランは月額500ドルと、他のAIツールの20倍以上の価格設定である。これは「ツール代」ではなく「人件費(ジュニアエンジニアの外注費)」として捉える必要がある。
• ACU(Agent Compute Unit): 課金はACUという計算単位で行われる。複雑なタスクほどACUを消費するため、コスト管理が難しい 29。
8.3 現実的な限界
デモでは魔法のように見えるDevinだが、実際の現場では「環境構築で詰まる」「無限ループに陥る」「修正が的外れ」といった課題が報告されている。特に、独自の複雑なアーキテクチャを持つプロジェクトや、ドキュメント化されていない暗黙知が必要なタスクにおいては、人間が介入してCursorで修正した方が遥かに速いという結論に至るケースも多い。現状では、単純なバグ修正や、ライブラリのバージョンアップ、テストコードの記述といった定型的なタスクにおいてのみ、そのコストに見合う価値を発揮すると評価されている 31。
9. 比較総括:機能・価格・対象ユーザーツール名カテゴリ価格モデル (Pro)主な強み主な弱点最適なユーザー層CursorAIネイティブIDE$20/月カスタマイズ性、マルチファイル編集、安定性設定の学習コスト、Electronの重さ熟練エンジニア、複雑なプロジェクトWindsurfAIネイティブIDE$15/月速度、フロー維持、コンテキスト自動認識安定性不足、過度な自律性の制御難新規開発、スピード重視の個人GitHub Copilotプラットフォーム拡張$10/月 (個人)
$19/月 (Biz)エコシステム統合、マルチモデル、セキュリティIDE体験の統合度の低さ、コンテキスト理解の浅さエンタープライズ、GitHubユーザーAmazon Qクラウド特化$19/月 (Pro)
無料枠ありAWSインフラ構築、CLI統合、Java移行汎用開発での性能不足、UXの粗さAWSヘビーユーザー、SRE、OpsBolt.newブラウザ開発$20/月 (トークン制)環境構築不要、即時デプロイ、フルスタック生成トークン消費コスト、大規模開発への不向き起業家、プロトタイピング、非エンジニアDevin自律エージェント$500/月~ (Team)完全自律実行、非同期タスク処理極めて高額、成功率の不安定さ予算潤沢なチーム、定型保守タスクの自動化
10. 結論と将来展望
10.1 市場の分化と共存
2025年の市場は、一つのツールがすべてを支配するのではなく、用途に応じた使い分けが進む「適材適所」のフェーズにある。
• 日常的なコーディング: CursorまたはWindsurfがデファクトスタンダードとなる。
• 組織的な管理とセキュリティ: GitHub Copilotがインフラとして導入される。
• 特定のタスク: クラウド構築にはAmazon Q、プロトタイプにはBolt.newが併用される。
10.2 MCP(Model Context Protocol)によるコネクティビティの爆発
今後の最大の技術トレンドは、Anthropicが提唱し、WindsurfやCursorが採用を進めている MCP(Model Context Protocol) である。これにより、AIエージェントはIDEの枠を超え、Slack、Notion、Linear、Google Drive、PostgreSQLといった外部ツールと標準化された方法で接続できるようになる 1。
未来のエージェントは、「Slackで報告されたバグを読み取り、Linearでチケット化し、Notionの仕様書を参照してコードを修正し、DBのマイグレーションを実行する」という一連の業務フロー全体をオーケストレーションする存在へと進化するだろう。
10.3 開発者の役割の変化
AIコーディングエージェントの普及は、開発者に対し「コーディング(Writing Code)」から「エンジニアリング(Designing & Reviewing)」へのシフトを要求している。AIが生成するコードの品質を瞬時に判断するレビュー能力、そしてAIに適切なコンテキストと制約を与えるプロンプトエンジニアリング能力(あるいはコンテキストエンジニアリング能力)が、これからのエンジニアにとって最も重要なスキルセットとなる。
以上、2025年の主要AIコーディングエージェントに関する包括的な調査報告とする。各ツールは日進月歩で進化しており、導入に際しては最新のアップデート情報と、組織固有の要件(セキュリティ、予算、技術スタック)を照らし合わせた慎重な選定が推奨される。

やっぱり長すぎて,読む気にならない😅
(ざっと読んだ感じ,ちょっと前のトレンドって感じでした.DeepResearchの精度に関してはこの記事では触れないです 🙇)

スライド生成AIを使ってDeepResearchの出力を可視化する

ここからが本題です.スライド生成AIを使ってDeepResearchの長文がどれぐらい,理解しやすく内容を端折ることなく説明できるのか見ていきたいと思います.
今回用いたスライド生成AIは以下の4つです.

  • Geminiの動的ビュー
  • NotebookLM
  • Manus
  • skywork
次のDeepResearchのレポートを、内容を一切省略せずにスライド形式へ変換してください。
本文ではイラストや図表を活用して視覚的にわかりやすく説明してください。

{{ DeepResearchの出力 }}

これは今回のスライド生成の際に用いたプロンプトです.
とても簡潔に書いたので,改善の余地ありですが...

Geminiの動的ビュー

Geminiの動的ビューは2025年11月に公開されたもので,プロンプトをもとに簡単なwebアプリを生成してくれるツール
使い方は以下の画像のように,ツールの動的ビューを選択してプロンプトを入力するだけです.

スライド生成結果

このGeminiの動的ビューは画像生成しているわけではなく,htmlを生成している.
そのため,最近のLLMによる画像生成に多い文字化けは全くない.
また,プログラミング関連だとコードをコピーできるのも良い点だと思った.
そして,htmlなので,動的なクリックによるトグルの開閉などができるため,webサイトで調べているような感覚に近いと感じた.
しかし,おそらく画像生成をしていないので,イラストによる説明がないため,理解するのが難しい部分がある.スライドに表示されている画像はその内容っぽいものを適当に載せているみたいな印象を受けた.

NotebookLM

NotebookLMを用いたスライド生成はgeminiの動的プレビュー同様,2025年11月に公開され,話題になったものです.
使い方は,新しいノートを作成して,コピーしたテキストをクリックしDeepResearchの出力をペーストする.

その後,スライド資料の鉛筆マークをクリックします.

そして,「作成するスライドについて説明してください」のところにプロンプトを入力して生成をクリックする.

スライド生成結果

Geminiの動的ビューとは真逆の結果となった.
NotebookLMのスライド生成は画像生成を用いてスライドを作成している.
イラストは,内容に沿ったものでわかりやすくその上SlackやNotionなどのアイコンも正しいものを表示できている.
画像生成のデメリットである,文字化けは少しある,特に漢字の部分で文字化けが多かったが,読めるレベルなので問題ないと思う.
そして,NotebookLMはわからない部分を質問することで,DeepResearchの出力を基にした回答とその参照位置がわかるので,非常に使い勝手が良かった.
しかし,コピーはできないため,ソースコードなどを生成した場合は文字認識などの方法が必要になる.

Manus

Manusは中国発のAIエージェントツールとして人気があるものです.
使い方は,スライドを作成をクリックして,プロンプトを入力するだけです.

スライド生成結果

Manusのスライド生成は,DeepResearchの検索結果をちょっとまとめて,ちょっとだけ図表を入れたみたいな印象を受けた.スライドは,ただ単に箇条書きなどの少し見やすいように書き換えたような感じだった.
Geminiの動的ビュー同様htmlを生成する手法のため,イラストによる説明はNotebookLMの方がわかりやすいと感じた.
Manusの良い点としては,生成したスライドを編集できる.
また,表に関しては画像生成より見やすいため,このスライドを用いてプレゼンなどをする場合は使えるかもしれない.(イラストの部分だけ自分で用意するなどの編集は必要)
Manusは1日無料で300クレジット獲得できる.今回のスライド生成には158クレジット消費したので,1日に2回ぐらいはスライド生成できます.(内容によると思いますが...)

skywork

skyworkは僕が何回か使ったことのあるスライド生成エージェントであり,比較のために利用した.
使い方はほとんどManusと同じのため省略します.
skyworkの特徴は,スライド作成において,どのような体裁が良いかをチャット形式で決めることができる.

スライド生成結果

skyworkのスライド生成は,ほとんどそのままプレゼン資料として利用できそうなぐらい,一番綺麗に作成できていた.
しかし,1週間に500クレジット無料で獲得できるのですが,スライド生成を行うと500クレジットを使い切って,途中で途切れてしまったため,断念しました.(中途半端ですみません 🙇)
スライド作成する際にNano Banana Pro(Geminiの画像生成モデル)を使用するかどうか選択できたのですが,これを使用したため,クレジットを多く消費したのだと思います.

総括

今回色々スライド生成AIを試してみましたが,DeepResearchの出力をできるだけ読まないという目的の場合は,NotebookLMが最適だと思います.
また開発に関しての調査の際に,ソースコードをコピーしたいなどの目的であれば,Geminiがいいと感じました.
skyworkは,プレゼン資料作成をする際には課金が必要になると思いますが,とても良いツールでした.
全体的に,もう少しプロンプトを改善することで,より良いスライドを作成できると思うので,ぜひ皆さんも試してみてください!

ツール スライドの形式 画像生成 日本語対応 特徴
Gemini 動的ビュー HTML (Webアプリ) × コードがコピー可能・webサイトのような操作感
NotebookLM 画像スライド
(少し文字化け)
イラストを含めた説明・質問が可能
Manus HTML
(図表中心)
編集可能・箇条書きベース
Skywork プレゼン資料 デザインが綺麗・クレジット消費大
NISLab 小板研究室

Discussion