Claude CodeからGemini/Qwen/Codex/Cursor/CodeRabbit/Amp/Droidを協業させてみた
概要
TrackAIコンペティションでの失敗後も、AI同士を協業させる仕組みの開発を継続してきました。本記事では、その成果として「Claude Code から複数のAIツールを呼び分けて協業させる」ワークフローを紹介します。
AIツールは日進月歩で進化しています。CodeRabbit、Amp、 Droid も追加した結果、当初の5AIから8AIへと拡張されました。
multi-ai-orchestrium はオープンソースとして公開しており、個人ユース想定ながら、興味があれば自由に利用・貢献いただけます。Bash スクリプトのため、Claude Code 以外(Codex や Gemini 等)からも実行可能です。
私のユースケースでは、既存プロジェクトには CoA 関数[1]での解析、新規開発には ChatDev[2] による推進を採用。レビュー工程では Codex と CodeRabbit のデュアルレビューにより品質を高めています。
実装計画とテスト計画は、きのぴーさんのプロンプトを併用すると非常に効果的です。
参考プロンプト
実装計画プロンプト
テスト計画プロンプト
マルチAIを Bash でオーケストレーションすることで、単体AIでは届きにくい開発・分析・レビューの生産性を実現できます。一方で、タイムアウトやコンテキスト上限、コスト・鍵管理など運用上の配慮が不可欠です。小さく試し、ログ設計と役割分担を明確にすることが成功の鍵です。
最小の導入手順
# 1) リポジトリをクローン
git clone https://github.com/CaCC-Lab/multi-ai-orchestrium
cd multi-ai-orchestrium
# 2) 実行(例:ChatDev開発ワークフロー)
./orchestrate-7ai.sh chatdev-develop "新プロジェクトの概要"
実装パターン
🔗 Chain-of-Agents (CoA) パターン
CoA = 分割統治型並列解析。全AIが同時に異なる視点で分析し、Manager が統合するパターン。
- 実行フロー
# Phase 1: Parallel Worker Analysis (複数AI全員並列)
- parallel:
- Claude: 構造分析
- Gemini: コンテンツ分析
- Amp: プロジェクトコンテキスト分析 (non-blocking)
- Qwen: コード例分析
- Droid: 実装パターン分析
- Codex: 技術複雑度分析
- Cursor: 統合パターン分析
# Phase 2: Manager Synthesis (統合)
- Claude: Manager統合
input_from: [gemini, amp, qwen, droid, codex, cursor]
- 特徴
- 完全並列: 複数AIが同時に異なる視点で分析
- O(nk)複雑度: Manager1名がWorker7名の結果を統合
- input_from: 前フェーズの出力を次フェーズに渡す
🔄 ChatDev パターン
ChatDev = 役割ベース開発ワークフロー。企業組織を模した階層的プロセスで、CEOから始まり PM→CTO→プログラマー→レビュアー→テスターと順次実行します。
- 実行フロー
# Phase 1: CEO & PM - ビジョンと計画 (並列)
- parallel:
- Claude: プロダクトビジョン
- Amp: プロジェクト管理 (non-blocking)
# Phase 2: CTO & Research - 設計と技術選定 (並列)
- parallel:
- Claude: 技術設計
- Gemini: ベストプラクティス調査 (non-blocking)
# Phase 3: Programmers - 実装 (並列競争)
- parallel:
- Qwen: 高速実装
- Droid: 品質重視実装
# Phase 4: Reviewer - コードレビュー (順次)
- Codex: コードレビュー
# Phase 5: Tester - テスト (順次)
- Cursor: QAテスト
- 特徴
- 階層的実行: CEO→CTO→Programmer→Reviewer→Testerの順
- 並列+競争: QwenとDroidが同時実装して品質比較
- blocking制御: 重要タスク失敗で即中止、非重要は継続
🔍 デュアルレビューパターン
デュアルレビューは、Codex と CodeRabbit の2つのAIレビューツールを並列実行し、その結果を比較分析する高度なコードレビューシステムです。並行実行により次の相乗効果が得られます。この設計により、2つのAIレビューツールの長所を組み合わせ、高速性と包括性の両立を実現します。
- 実行フロー
# Phase 1: 並列レビュー実行
- Codex Review
- CodeRabbit Review
# Phase 2: 比較分析とレポート生成
- デュアルレビュー比較レポート作成
- 特徴
- カバレッジの最大化: 各ツールが異なるパターンを検出
- 誤検知の削減: 両ツールが一致した問題は高信頼度
- 多角的分析: 異なる視点からのコードレビュー
- ベストプラクティス: Codexの速度 + CodeRabbitの深度
🎯 各AIの役割変更
各AIの役割・タイムアウト・実行順序・並列/順次・blocking などをスクリプトを一切変えずに、YAML編集だけで役割分担を入れ替えられます。
- どのAIをどのフェーズに割り当てるか
- 並列実行か順次実行か
- タイムアウト時間
- 失敗時の挙動(blocking)
- 新しいワークフロー/プロファイルの追加
📝 具体的な変更例
例1: ChatDev ワークフローで CEO を Gemini に変更
7ai-chatdev-develop:
phases:
- name: "CEO & PM - Vision & Planning"
parallel:
- name: "Gemini - Product Vision"
ai: gemini # ← ここを切替
role: ceo-product-vision
timeout: 300
効果: 長文コンテキストとウェブ検索を活かしたビジョン策定。
例2: 実装フェーズを Droid 単独にして品質重視
- name: "Enterprise Implementation"
ai: droid # ← 並列→順次に切り替え
role: programmer-enterprise
timeout: 1200 # 余裕を持たせる
効果: 速度より品質を優先。自動検証と型安全を最大活用。
例3: CoA で Manager を Gemini に変更
- name: "Manager Synthesis"
ai: gemini # ← Manager を切替
role: manager-synthesis
input_from: ["claude", "amp", "qwen", "droid", "codex", "cursor"]
timeout: 600
効果: 大容量コンテキストで全 Worker の結果を一括統合。
例4: 新しいワークフロー(セキュリティ監査)を追加
7ai-security-audit:
phases:
- name: "Security Scanning"
parallel:
- { ai: gemini, role: security-research, timeout: 600 }
- { ai: codex, role: security-analysis, timeout: 300 }
- name: "Security Fix Implementation"
ai: droid
role: security-fix
input_from: ["gemini", "codex"]
timeout: 900
- name: "Architecture Security Review"
ai: claude
role: security-architecture-review
timeout: 300
🔧 変更可能なパラメータ
- AI割り当て:
ai: claude | gemini | amp | qwen | droid | codex | cursor
- 役割定義:
role: ceo-product-vision
(自由に追加可) - タイムアウト:
timeout: 300
(秒) - 実行モード: 並列は
parallel:
、順次はai:
のみ - ブロッキング:
blocking: true|false
- 入力参照:
input_from: ["qwen", "droid"]
⚙️ 変更の適用方法
実行スクリプトは毎回 YAML を読み込むため、再起動不要で即反映されます。
# 1) YAMLを編集
# 2) そのまま実行(自動リロード)
# 3) デフォルトプロファイル変更(例)
default_profile: "ultra-fast-7ai"
既知の課題
- タイムアウト: 長時間タスクや外部依存での処理待ちが発生しやすい。
- コンテキスト: ツール間でのコンテキスト引き継ぎや上限管理が難しい。
Bash を選んだ理由(MCP/サブエージェントとの比較)
MCP やサブエージェントも検討しましたが、現状ではタイムアウトとコンテキストの制約をクリアできず、手堅く制御しやすい Bash スクリプト構成に落ち着きました。将来的な改善により置き換えも検討します。
リポジトリ・ライセンス
multi-ai-orchestriumの理念
-
「AIが競争ではなく協奏する」思想
-
Claude Codeが「指揮者」として果たす役割
-
プロジェクトの目標(例:AI間連携による創発知の実現)
-
Orchestriumの語源(Orchestra + -ium)=「協奏の場」
-
複数のAIの多様性と共鳴の意義
-
「制御ではなく調和」「支配ではなく統率」という設計思想
-
比喩構造(音楽/交響/共鳴/創発)
-
核心スローガン:
“Resonance Beyond Rivalry — 競争を超えた共鳴へ。”
謝辞
このプロジェクトは以下の研究・プロジェクトから着想を得ています:
学術研究
-
ChatDev - AI協調開発の先駆的研究
- 役割ベース協調開発(CEO/CTO/プログラマー/レビュアー/テスター)のアイデア
- 6フェーズTDDワークフローの基礎
-
Chain-of-Agents - 大規模マルチエージェント協調
- 階層的AI統率パターン(Manager-Worker構造)
- 並列実行とタスク分割のアプローチ
-
A Critical Perspective on Multi-Agent Systems - マルチエージェントシステムの課題と適切な使用場面に関する考察
- マルチエージェントの限界と最適なユースケースの理解
- シンプルな実装の重要性の認識
オープンソースプロジェクト
-
Vibe Logger - AI用構造化ロギング
- AI向けログフォーマット(human_note、ai_todo、ai_intent)
- 各AIラッパーのログ実装に採用
-
kinopeee/cursorrules - Cursor AIの効果的な活用ルールとベストプラクティス集
- タスク分類システム(🟢🟡🔴)のアイデア
- AGENTS.mdの設計基盤
登場AIツール
シリーズ記事
- 本編:優秀な5AIを活かせなかった私の60回 — Zennで読む
- 5AI協調システムで挑んだ60回の提出の記録。期待と現実のギャップ、そして11位という結果に至るまでの苦闘を綴った体験記。
- 番外編:5AIツールに聞く!TrackAIコンペの真実 — Zennで読む
- Claude、Gemini、Qwen、Codex、Cursor の5AIが語る、それぞれの視点から見たコンペティション。
- アフターイベント編:上位入賞者を見て分かった11位の理由 — Zennで読む
- Zoom アフターイベントで上位入賞者の解法を聞いて学んだこと。シンプルさの美学と、複雑さの罠。
Discussion