🤖

Devinが複数のDevinを束ねてタスクしてくれるようになった

に公開

2026年3月19日、Cognition社がDevinの新機能を発表しました。その名も「Devin can now Manage Devins」。1つのDevinセッションが複数のDevinを束ねて、大きなタスクを並列でさばけるようになったアップデートです。

https://cognition.ai/blog/devin-can-now-manage-devins

https://www.youtube.com/watch?v=F2yiwgO3-rc

どうやって使うのか

特別なコマンドやボタンがあるわけではありません。普通にDevinへタスクを指示するだけです。たとえばブログに載っている例だと、こんなプロンプトを投げます。

  • 「アプリの全ページをQAして」
  • 「フロントエンドのアイコンライブラリを移行して」
  • 「依存パッケージのセキュリティ監査をして」

Devinがタスクの規模を判断して、必要に応じて自動的に複数の子セッションを立ち上げます。ユーザー側で「並列モードにする」といった切り替えは要りません。

どんな仕組みか

ざっくり言うと、メインのDevinセッションがコーディネータとして振る舞い、配下に複数の子Devinセッションを立ち上げて作業を分担させます。

子Devinはそれぞれ独立した仮想マシンで動きます。ターミナル、ブラウザ、開発環境はセッションごとに分離されていて、お互い干渉しません。テストランナーも各セッション固有なので、環境の汚れを気にせず済みます。

コーディネータ側はタスクを分解して各セッションへ振り分け、進捗を見守ります。競合があれば解決し、最終的に結果をまとめるところまで担当します。人間のテックリードがやる仕事を、Devinが自動でこなすイメージですね。

具体的なユースケース

ブログでは5つのユースケースが紹介されています。

QAの並列実行

アプリの複数ページを同時にテストするケースです。今まで1つのセッションで順番にテストしていたのが、ページごとにセッションを分けて一気に回せるようになります。テスト対象が多いプロジェクトだと、かなり時短になりそうです。

大規模マイグレーション

アイコンライブラリの一括置き換えのような、ファイル数が多い移行作業。手作業でやると果てしないですが、セッションを分けて並列に処理すれば現実的な時間で終わります。

セキュリティ監査

複数のサービスやパッケージの脆弱性チェックを、10セッション同時に走らせる例が挙げられています。依存関係の洗い出しとセキュリティスキャンを並列で実行できるので、監査の網羅性とスピードが両立します。

コードリファクタリング

クラスコンポーネントを関数コンポーネントに変換するような、パターンが決まっているリファクタリング。ファイルやモジュール単位でセッションを分けられるので、大規模なコードベースでも一気に片付きます。

機能テスト

最近マージされたPRをベースに、リリース機能の動作確認を並列で走らせるケースです。各セッションが独立した環境で検証するので、テスト同士が影響し合うこともありません。

使い勝手はどうなっているか

コーディネータからは、任意のタイミングで子セッションにメッセージを送ったり、コンテキストを修正したりできます。セッションごとの計算リソース使用量がトラッキングされるので、コストの把握も楽です。不要なセッションの一時停止や終了、チェックポイントの設定にも対応しています。

ブログによると、この機能は現在すべてのDevinユーザーに開放されているとのことです。

Scheduled Devinsとの組み合わせ

同時期に発表されたScheduled Devinsと組み合わせると、さらに面白いことができます。

https://cognition.ai/blog/devin-can-now-schedule-devins

https://www.youtube.com/watch?v=z2jOtpLVCr0

Scheduled Devinsは、定期実行したい内容を自然言語で伝えるだけでDevinがスケジュールを自分で設定してくれる機能です。cronジョブやワークフロービルダーは要りません。ブログでは3つの事例が紹介されています。

  • 毎週月曜9時に、14日以上100%ロールアウト済みのフィーチャーフラグを検出して削除PRを作成
  • 毎週金曜17時に、マージされたPRをバグ修正・新機能・インフラに分類してリリースノートをSlackに投稿
  • 毎朝8時にステージング環境でテストを実行してレポートを投稿

地味にすごいのは、Devinがセッション間で独自のノートを読み書きして文脈を保持できる点です。前回どこまで処理したかを覚えているので、同じ作業を重複して実行しません。毎回ゼロからやり直すわけではないんですね。

Managed Devinsとの連携も自然にできます。たとえば毎朝のQAでは、アプリの各ページごとにManaged Devinを立ち上げて並列テストし、結果を1つのレポートにまとめてSlackに流す、といったワークフローが組めます。

ブログを読んで気になったところ

AIエージェントが別のAIエージェントを管理する。去年あたりから各社が取り組んでいたテーマですが、Devinの実装はかなり踏み込んでいます。5つのユースケースがすでに用意されていて、すべてのユーザーに開放済みという点も強気です。

設計面で目を引くのは、セッションごとに完全分離された仮想マシンを割り当てているところです。マルチエージェントでありがちな「エージェント同士で環境を壊し合う」問題を、インフラレベルで回避しています。

一方で気になるのはコストです。並列実行すればその分だけ課金が積み上がります。Devinはもともと他のAIエージェントと比べて料金が高めに設定されているので、エージェント単体でこなせる作業にわざわざDevinを使う必要があるのかは、都度検討したほうがよさそうです。

とはいえ、SlackやJIRAに簡単に組み込める点は見逃せません。非エンジニアでも自然言語で実装を依頼できて、しかもそれが並列で走ってくれる。そういう使い方ができるなら、コストに見合う場面は十分ありそうです。

AIエージェントの使い方が「1対1で対話する」から「チームとして束ねる」へ変わりつつある。その方向性がはっきり見えるアップデートでした。

Discussion