📘

Claude CodeからGemini/Qwen/Codex/Cursor/CodeRabbit/Amp/Droidを協業させてみた

2025/10/22に公開

概要

TrackAIコンペティションでの失敗後も、AI同士を協業させる仕組みの開発を継続してきました。本記事では、その成果として「Claude Code から複数のAIツールを呼び分けて協業させる」ワークフローを紹介します。

AIツールは日進月歩で進化しています。CodeRabbit、Amp、 Droid も追加した結果、当初の5AIから8AIへと拡張されました。

multi-ai-orchestrium はオープンソースとして公開しており、個人ユース想定ながら、興味があれば自由に利用・貢献いただけます。Bash スクリプトのため、Claude Code 以外（Codex や Gemini 等）からも実行可能です。

私のユースケースでは、既存プロジェクトには CoA 関数^[1]での解析、新規開発には ChatDev^[2] による推進を採用。レビュー工程では Codex と CodeRabbit のデュアルレビューにより品質を高めています。

実装計画とテスト計画は、きのぴーさんのプロンプトを併用すると非常に効果的です。

参考プロンプト

実装計画プロンプト

テスト計画プロンプト

マルチAIを Bash でオーケストレーションすることで、単体AIでは届きにくい開発・分析・レビューの生産性を実現できます。一方で、タイムアウトやコンテキスト上限、コスト・鍵管理など運用上の配慮が不可欠です。小さく試し、ログ設計と役割分担を明確にすることが成功の鍵です。

最小の導入手順

# 1) リポジトリをクローン
git clone https://github.com/CaCC-Lab/multi-ai-orchestrium
cd multi-ai-orchestrium

# 2) 実行（例：ChatDev開発ワークフロー）
./orchestrate-7ai.sh chatdev-develop "新プロジェクトの概要"

実装パターン

🔗 Chain-of-Agents (CoA) パターン

CoA = 分割統治型並列解析。全AIが同時に異なる視点で分析し、Manager が統合するパターン。

実行フロー

# Phase 1: Parallel Worker Analysis (複数AI全員並列)
- parallel:
    - Claude: 構造分析
    - Gemini: コンテンツ分析
    - Amp: プロジェクトコンテキスト分析 (non-blocking)
    - Qwen: コード例分析
    - Droid: 実装パターン分析
    - Codex: 技術複雑度分析
    - Cursor: 統合パターン分析

# Phase 2: Manager Synthesis (統合)
- Claude: Manager統合
  input_from: [gemini, amp, qwen, droid, codex, cursor]

特徴
- 完全並列: 複数AIが同時に異なる視点で分析
- O(nk)複雑度: Manager1名がWorker7名の結果を統合
- input_from: 前フェーズの出力を次フェーズに渡す

🔄 ChatDev パターン

ChatDev = 役割ベース開発ワークフロー。企業組織を模した階層的プロセスで、CEOから始まり PM→CTO→プログラマー→レビュアー→テスターと順次実行します。

実行フロー

# Phase 1: CEO & PM - ビジョンと計画 (並列)
- parallel:
    - Claude: プロダクトビジョン
    - Amp: プロジェクト管理 (non-blocking)

# Phase 2: CTO & Research - 設計と技術選定 (並列)
- parallel:
    - Claude: 技術設計
    - Gemini: ベストプラクティス調査 (non-blocking)

# Phase 3: Programmers - 実装 (並列競争)
- parallel:
    - Qwen: 高速実装
    - Droid: 品質重視実装

# Phase 4: Reviewer - コードレビュー (順次)
- Codex: コードレビュー

# Phase 5: Tester - テスト (順次)
- Cursor: QAテスト

特徴
- 階層的実行: CEO→CTO→Programmer→Reviewer→Testerの順
- 並列+競争: QwenとDroidが同時実装して品質比較
- blocking制御: 重要タスク失敗で即中止、非重要は継続

🔍 デュアルレビューパターン

デュアルレビューは、Codex と CodeRabbit の2つのAIレビューツールを並列実行し、その結果を比較分析する高度なコードレビューシステムです。並行実行により次の相乗効果が得られます。この設計により、2つのAIレビューツールの長所を組み合わせ、高速性と包括性の両立を実現します。

実行フロー

# Phase 1: 並列レビュー実行
- Codex Review
- CodeRabbit Review
# Phase 2: 比較分析とレポート生成
- デュアルレビュー比較レポート作成

特徴
- カバレッジの最大化: 各ツールが異なるパターンを検出
- 誤検知の削減: 両ツールが一致した問題は高信頼度
- 多角的分析: 異なる視点からのコードレビュー
- ベストプラクティス: Codexの速度 + CodeRabbitの深度

🎯 各AIの役割変更

各AIの役割・タイムアウト・実行順序・並列/順次・blocking などをスクリプトを一切変えずに、YAML編集だけで役割分担を入れ替えられます。

どのAIをどのフェーズに割り当てるか
並列実行か順次実行か
タイムアウト時間
失敗時の挙動（blocking）
新しいワークフロー/プロファイルの追加

📝 具体的な変更例

例1: ChatDev ワークフローで CEO を Gemini に変更

7ai-chatdev-develop:
  phases:
    - name: "CEO & PM - Vision & Planning"
      parallel:
        - name: "Gemini - Product Vision"
          ai: gemini   # ← ここを切替
          role: ceo-product-vision
          timeout: 300

効果: 長文コンテキストとウェブ検索を活かしたビジョン策定。

例2: 実装フェーズを Droid 単独にして品質重視

- name: "Enterprise Implementation"
  ai: droid            # ← 並列→順次に切り替え
  role: programmer-enterprise
  timeout: 1200        # 余裕を持たせる

効果: 速度より品質を優先。自動検証と型安全を最大活用。

例3: CoA で Manager を Gemini に変更

- name: "Manager Synthesis"
  ai: gemini           # ← Manager を切替
  role: manager-synthesis
  input_from: ["claude", "amp", "qwen", "droid", "codex", "cursor"]
  timeout: 600

効果: 大容量コンテキストで全 Worker の結果を一括統合。

例4: 新しいワークフロー（セキュリティ監査）を追加

7ai-security-audit:
  phases:
    - name: "Security Scanning"
      parallel:
        - { ai: gemini, role: security-research, timeout: 600 }
        - { ai: codex,  role: security-analysis, timeout: 300 }
    - name: "Security Fix Implementation"
      ai: droid
      role: security-fix
      input_from: ["gemini", "codex"]
      timeout: 900
    - name: "Architecture Security Review"
      ai: claude
      role: security-architecture-review
      timeout: 300

🔧 変更可能なパラメータ

AI割り当て: ai: claude | gemini | amp | qwen | droid | codex | cursor
役割定義: role: ceo-product-vision（自由に追加可）
タイムアウト: timeout: 300（秒）
実行モード: 並列は parallel:、順次は ai: のみ
ブロッキング: blocking: true|false
入力参照: input_from: ["qwen", "droid"]

⚙️ 変更の適用方法

実行スクリプトは毎回 YAML を読み込むため、再起動不要で即反映されます。

# 1) YAMLを編集

# 2) そのまま実行（自動リロード）

# 3) デフォルトプロファイル変更（例）
default_profile: "ultra-fast-7ai"

既知の課題

タイムアウト: 長時間タスクや外部依存での処理待ちが発生しやすい。
コンテキスト: ツール間でのコンテキスト引き継ぎや上限管理が難しい。

Bash を選んだ理由（MCP/サブエージェントとの比較）

MCP やサブエージェントも検討しましたが、現状ではタイムアウトとコンテキストの制約をクリアできず、手堅く制御しやすい Bash スクリプト構成に落ち着きました。将来的な改善により置き換えも検討します。

リポジトリ・ライセンス

multi-ai-orchestriumの理念

「AIが競争ではなく協奏する」思想
Claude Codeが「指揮者」として果たす役割
プロジェクトの目標（例：AI間連携による創発知の実現）
Orchestriumの語源（Orchestra + -ium）＝「協奏の場」
複数のAIの多様性と共鳴の意義
「制御ではなく調和」「支配ではなく統率」という設計思想
比喩構造（音楽／交響／共鳴／創発）
核心スローガン：

“Resonance Beyond Rivalry — 競争を超えた共鳴へ。”

謝辞

このプロジェクトは以下の研究・プロジェクトから着想を得ています：

学術研究

ChatDev - AI協調開発の先駆的研究
- 役割ベース協調開発（CEO/CTO/プログラマー/レビュアー/テスター）のアイデア
- 6フェーズTDDワークフローの基礎
Chain-of-Agents - 大規模マルチエージェント協調
- 階層的AI統率パターン（Manager-Worker構造）
- 並列実行とタスク分割のアプローチ
A Critical Perspective on Multi-Agent Systems - マルチエージェントシステムの課題と適切な使用場面に関する考察
- マルチエージェントの限界と最適なユースケースの理解
- シンプルな実装の重要性の認識

オープンソースプロジェクト

Vibe Logger - AI用構造化ロギング
- AI向けログフォーマット（human_note、ai_todo、ai_intent）
- 各AIラッパーのログ実装に採用
kinopeee/cursorrules - Cursor AIの効果的な活用ルールとベストプラクティス集
- タスク分類システム（🟢🟡🔴）のアイデア
- AGENTS.mdの設計基盤

登場AIツール

シリーズ記事

本編：優秀な5AIを活かせなかった私の60回 — Zennで読む
- 5AI協調システムで挑んだ60回の提出の記録。期待と現実のギャップ、そして11位という結果に至るまでの苦闘を綴った体験記。
番外編：5AIツールに聞く！TrackAIコンペの真実 — Zennで読む
- Claude、Gemini、Qwen、Codex、Cursor の5AIが語る、それぞれの視点から見たコンペティション。
アフターイベント編：上位入賞者を見て分かった11位の理由 — Zennで読む
- Zoom アフターイベントで上位入賞者の解法を聞いて学んだこと。シンプルさの美学と、複雑さの罠。

脚注

Chain-of-Agents の簡易的な適用で、対象リポジトリの構造解析やタスク分解を行う関数的ユーティリティ。 ↩︎
役割分担（PM/設計/実装/レビュー/テスト）で進行するエージェント駆動開発フレームの研究/実装系統。 ↩︎