📘

Claude CodeからGemini/Qwen/Codex/Cursor/CodeRabbit/Amp/Droidを協業させてみた

に公開

概要

TrackAIコンペティションでの失敗後も、AI同士を協業させる仕組みの開発を継続してきました。本記事では、その成果として「Claude Code から複数のAIツールを呼び分けて協業させる」ワークフローを紹介します。

AIツールは日進月歩で進化しています。CodeRabbit、Amp、 Droid も追加した結果、当初の5AIから8AIへと拡張されました。

multi-ai-orchestrium はオープンソースとして公開しており、個人ユース想定ながら、興味があれば自由に利用・貢献いただけます。Bash スクリプトのため、Claude Code 以外(Codex や Gemini 等)からも実行可能です。

私のユースケースでは、既存プロジェクトには CoA 関数[1]での解析、新規開発には ChatDev[2] による推進を採用。レビュー工程では Codex と CodeRabbit のデュアルレビューにより品質を高めています。

実装計画とテスト計画は、きのぴーさんのプロンプトを併用すると非常に効果的です。

参考プロンプト

実装計画プロンプト
https://x.com/kinopee_ai/status/1971049490506506349

テスト計画プロンプト
https://x.com/kinopee_ai/status/1979339143663751526

マルチAIを Bash でオーケストレーションすることで、単体AIでは届きにくい開発・分析・レビューの生産性を実現できます。一方で、タイムアウトやコンテキスト上限、コスト・鍵管理など運用上の配慮が不可欠です。小さく試し、ログ設計と役割分担を明確にすることが成功の鍵です。

最小の導入手順

# 1) リポジトリをクローン
git clone https://github.com/CaCC-Lab/multi-ai-orchestrium
cd multi-ai-orchestrium

# 2) 実行(例:ChatDev開発ワークフロー)
./orchestrate-7ai.sh chatdev-develop "新プロジェクトの概要"

実装パターン

🔗 Chain-of-Agents (CoA) パターン

CoA = 分割統治型並列解析。全AIが同時に異なる視点で分析し、Manager が統合するパターン。

  • 実行フロー
# Phase 1: Parallel Worker Analysis (複数AI全員並列)
- parallel:
    - Claude: 構造分析
    - Gemini: コンテンツ分析
    - Amp: プロジェクトコンテキスト分析 (non-blocking)
    - Qwen: コード例分析
    - Droid: 実装パターン分析
    - Codex: 技術複雑度分析
    - Cursor: 統合パターン分析

# Phase 2: Manager Synthesis (統合)
- Claude: Manager統合
  input_from: [gemini, amp, qwen, droid, codex, cursor]
  • 特徴
    • 完全並列: 複数AIが同時に異なる視点で分析
    • O(nk)複雑度: Manager1名がWorker7名の結果を統合
    • input_from: 前フェーズの出力を次フェーズに渡す

🔄 ChatDev パターン

ChatDev = 役割ベース開発ワークフロー。企業組織を模した階層的プロセスで、CEOから始まり PM→CTO→プログラマー→レビュアー→テスターと順次実行します。

  • 実行フロー
# Phase 1: CEO & PM - ビジョンと計画 (並列)
- parallel:
    - Claude: プロダクトビジョン
    - Amp: プロジェクト管理 (non-blocking)

# Phase 2: CTO & Research - 設計と技術選定 (並列)
- parallel:
    - Claude: 技術設計
    - Gemini: ベストプラクティス調査 (non-blocking)

# Phase 3: Programmers - 実装 (並列競争)
- parallel:
    - Qwen: 高速実装
    - Droid: 品質重視実装

# Phase 4: Reviewer - コードレビュー (順次)
- Codex: コードレビュー

# Phase 5: Tester - テスト (順次)
- Cursor: QAテスト
  • 特徴
    • 階層的実行: CEO→CTO→Programmer→Reviewer→Testerの順
    • 並列+競争: QwenとDroidが同時実装して品質比較
    • blocking制御: 重要タスク失敗で即中止、非重要は継続

🔍 デュアルレビューパターン

デュアルレビューは、Codex と CodeRabbit の2つのAIレビューツールを並列実行し、その結果を比較分析する高度なコードレビューシステムです。並行実行により次の相乗効果が得られます。この設計により、2つのAIレビューツールの長所を組み合わせ、高速性と包括性の両立を実現します。

  • 実行フロー
# Phase 1: 並列レビュー実行
- Codex Review
- CodeRabbit Review
# Phase 2: 比較分析とレポート生成
- デュアルレビュー比較レポート作成
  • 特徴
    • カバレッジの最大化: 各ツールが異なるパターンを検出
    • 誤検知の削減: 両ツールが一致した問題は高信頼度
    • 多角的分析: 異なる視点からのコードレビュー
    • ベストプラクティス: Codexの速度 + CodeRabbitの深度

🎯 各AIの役割変更

各AIの役割・タイムアウト・実行順序・並列/順次・blocking などをスクリプトを一切変えずに、YAML編集だけで役割分担を入れ替えられます。

  • どのAIをどのフェーズに割り当てるか
  • 並列実行か順次実行か
  • タイムアウト時間
  • 失敗時の挙動(blocking)
  • 新しいワークフロー/プロファイルの追加

📝 具体的な変更例

例1: ChatDev ワークフローで CEO を Gemini に変更
7ai-chatdev-develop:
  phases:
    - name: "CEO & PM - Vision & Planning"
      parallel:
        - name: "Gemini - Product Vision"
          ai: gemini   # ← ここを切替
          role: ceo-product-vision
          timeout: 300

効果: 長文コンテキストとウェブ検索を活かしたビジョン策定。

例2: 実装フェーズを Droid 単独にして品質重視
- name: "Enterprise Implementation"
  ai: droid            # ← 並列→順次に切り替え
  role: programmer-enterprise
  timeout: 1200        # 余裕を持たせる

効果: 速度より品質を優先。自動検証と型安全を最大活用。

例3: CoA で Manager を Gemini に変更
- name: "Manager Synthesis"
  ai: gemini           # ← Manager を切替
  role: manager-synthesis
  input_from: ["claude", "amp", "qwen", "droid", "codex", "cursor"]
  timeout: 600

効果: 大容量コンテキストで全 Worker の結果を一括統合。

例4: 新しいワークフロー(セキュリティ監査)を追加
7ai-security-audit:
  phases:
    - name: "Security Scanning"
      parallel:
        - { ai: gemini, role: security-research, timeout: 600 }
        - { ai: codex,  role: security-analysis, timeout: 300 }
    - name: "Security Fix Implementation"
      ai: droid
      role: security-fix
      input_from: ["gemini", "codex"]
      timeout: 900
    - name: "Architecture Security Review"
      ai: claude
      role: security-architecture-review
      timeout: 300

🔧 変更可能なパラメータ

  • AI割り当て: ai: claude | gemini | amp | qwen | droid | codex | cursor
  • 役割定義: role: ceo-product-vision(自由に追加可)
  • タイムアウト: timeout: 300(秒)
  • 実行モード: 並列は parallel:、順次は ai: のみ
  • ブロッキング: blocking: true|false
  • 入力参照: input_from: ["qwen", "droid"]

⚙️ 変更の適用方法

実行スクリプトは毎回 YAML を読み込むため、再起動不要で即反映されます。

# 1) YAMLを編集

# 2) そのまま実行(自動リロード)

# 3) デフォルトプロファイル変更(例)
default_profile: "ultra-fast-7ai"

既知の課題

  • タイムアウト: 長時間タスクや外部依存での処理待ちが発生しやすい。
  • コンテキスト: ツール間でのコンテキスト引き継ぎや上限管理が難しい。
Bash を選んだ理由(MCP/サブエージェントとの比較)

MCP やサブエージェントも検討しましたが、現状ではタイムアウトとコンテキストの制約をクリアできず、手堅く制御しやすい Bash スクリプト構成に落ち着きました。将来的な改善により置き換えも検討します。

リポジトリ・ライセンス

https://github.com/CaCC-Lab/multi-ai-orchestrium

multi-ai-orchestriumの理念
  • 「AIが競争ではなく協奏する」思想

  • Claude Codeが「指揮者」として果たす役割

  • プロジェクトの目標(例:AI間連携による創発知の実現)

  • Orchestriumの語源(Orchestra + -ium)=「協奏の場」

  • 複数のAIの多様性と共鳴の意義

  • 「制御ではなく調和」「支配ではなく統率」という設計思想

  • 比喩構造(音楽/交響/共鳴/創発)

  • 核心スローガン:

    “Resonance Beyond Rivalry — 競争を超えた共鳴へ。”

謝辞

このプロジェクトは以下の研究・プロジェクトから着想を得ています:

学術研究

  • ChatDev - AI協調開発の先駆的研究

    • 役割ベース協調開発(CEO/CTO/プログラマー/レビュアー/テスター)のアイデア
    • 6フェーズTDDワークフローの基礎
  • Chain-of-Agents - 大規模マルチエージェント協調

    • 階層的AI統率パターン(Manager-Worker構造)
    • 並列実行とタスク分割のアプローチ
  • A Critical Perspective on Multi-Agent Systems - マルチエージェントシステムの課題と適切な使用場面に関する考察

    • マルチエージェントの限界と最適なユースケースの理解
    • シンプルな実装の重要性の認識

オープンソースプロジェクト

  • Vibe Logger - AI用構造化ロギング

    • AI向けログフォーマット(human_note、ai_todo、ai_intent)
    • 各AIラッパーのログ実装に採用
  • kinopeee/cursorrules - Cursor AIの効果的な活用ルールとベストプラクティス集

    • タスク分類システム(🟢🟡🔴)のアイデア
    • AGENTS.mdの設計基盤

登場AIツール


シリーズ記事

  • 本編:優秀な5AIを活かせなかった私の60回 — Zennで読む
    • 5AI協調システムで挑んだ60回の提出の記録。期待と現実のギャップ、そして11位という結果に至るまでの苦闘を綴った体験記。
  • 番外編:5AIツールに聞く!TrackAIコンペの真実 — Zennで読む
    • Claude、Gemini、Qwen、Codex、Cursor の5AIが語る、それぞれの視点から見たコンペティション。
  • アフターイベント編:上位入賞者を見て分かった11位の理由 — Zennで読む
    • Zoom アフターイベントで上位入賞者の解法を聞いて学んだこと。シンプルさの美学と、複雑さの罠。
脚注
  1. Chain-of-Agents の簡易的な適用で、対象リポジトリの構造解析やタスク分解を行う関数的ユーティリティ。 ↩︎

  2. 役割分担(PM/設計/実装/レビュー/テスト)で進行するエージェント駆動開発フレームの研究/実装系統。 ↩︎

Discussion