agency-agentsの144エージェントは「どこまで使えるのか」を本気で調べてみた

に公開

はじめに

GitHubで話題になっている msitarzewski/agency-agents をご存知でしょうか。

「AIエージェントのドリームチームを組め」というコンセプトで、エンジニアリングからマーケティング、ゲーム開発、学術部門まで 144種類の専門エージェント が揃ったリポジトリです。Redditのスレッドから生まれ、最初の12時間で50件以上のリクエストが届いたという経緯もあり、コミュニティ発のプロジェクトとして急成長しています。

「144個もあって、実際どこまで使えるの?」という疑問が当然湧いてきます。本記事ではリポジトリの中身を徹底的に調べて、実用性・カバレッジ・限界を整理しました。


agency-agentsとは何か

一言で言えば「Claude Code(および主要なAIコーディングツール)向けの、専門特化したシステムプロンプト集」です。

各エージェントは単なる「〇〇として振る舞ってください」という一行プロンプトではなく、以下の要素を持つ構造化されたMarkdownファイルになっています。

  • Identity & Memory:エージェントの役割・性格・学習記憶
  • Core Mission:主要タスクと責務の詳細定義
  • Critical Rules:ドメイン固有のルールと禁止事項
  • Technical Deliverables:実際のコードサンプルや成果物テンプレート
  • Workflow Process:ステップ・バイ・ステップの作業フロー
  • Success Metrics:成果の定量的な測定基準

この設計の意図は「ジェネリックなAI」ではなく、「専門家らしいキャラクターと再現性ある成果物を持つAI」を作ることです。


12の部門・144エージェントの全体像

部門 エージェント数 代表的な専門家
💻 Engineering 26 Frontend Developer, Backend Architect, Security Engineer
🎨 Design 8 UI Designer, UX Researcher, Whimsy Injector
💰 Paid Media 6 PPC Campaign Strategist, Paid Media Auditor
💼 Sales 8 Outbound Strategist, Deal Strategist, Sales Coach
📢 Marketing 27 Growth Hacker, TikTok Strategist, Baidu SEO Specialist
📊 Product 5 Product Manager, Trend Researcher, Behavioral Nudge Engine
🎬 Project Management 6 Studio Producer, Project Shepherd, Senior PM
🧪 Testing 8 Reality Checker, Evidence Collector, Accessibility Auditor
🛟 Support 6 Analytics Reporter, Legal Compliance Checker
🥽 Spatial Computing 6 visionOS Spatial Engineer, WebXR Developer
🎯 Specialized 28 MCP Builder, Blockchain Security Auditor, Civil Engineer
🎮 Game Development 18 Unity Architect, Unreal Systems Engineer, Godot Scripter
📚 Academic 5 Anthropologist, Historian, Narratologist

特筆すべきは、中国市場向けのエージェントが非常に充実している点です。Xiaohongshu・WeChat・Douyin・Baidu・Bilibili・Kuaishou・TaobaoなどをカバーするSpecialistが10名以上います。これはコミュニティのグローバルな貢献によるものです。


実際のエージェントファイルを見てみる

engineering/engineering-frontend-developer.md を例に確認すると、その質の高さがわかります。

単に「ReactとVueに詳しいエンジニア」として振る舞うだけでなく、次の内容が含まれています。

  • Core Web Vitals(LCP < 2.5s、FID < 100ms、CLS < 0.1)の具体的な目標値
  • @tanstack/react-virtual を使った仮想化テーブルの実装例(実際に動くTypeScriptコード)
  • WCAG 2.1 AA準拠のアクセシビリティチェックリスト
  • 「Lighthouse 90点以上」「本番環境でのコンソールエラーゼロ」という定量的な成功指標

このように「コードも書けて、品質基準も持っている専門家」として機能するよう設計されています。


実用性が高い領域

エンジニアリング部門

Frontend Developer / Backend Architect / Security Engineer などは、定量的な成果指標と具体的なコード例を持っており、Claude Codeで使うと従来の汎用プロンプトより格段に一貫した品質のコードを生成します。特に Code ReviewerReality Checker の組み合わせは「実装→品質チェック」のループとして有効です。

Incident Response Commander は本番インシデントの指揮系統・ポストモーテム作成まで定義されており、オンコール対応の補助ツールとして実戦投入できます。

テスト部門

Evidence Collector(スクリーンショットによる証跡収集)と Reality Checker(本番リリース前の品質ゲート)は、テスト工程に「証拠ベースのQA」という哲学を持ち込む面白いコンセプトです。AIがテストを書くだけでなく、「視覚的な証明を求める」姿勢が明確に定義されている点は他のプロンプト集にはない特徴です。

ゲーム開発部門

Unity・Unreal・Godot・Blender・Robloxと主要エンジンをすべてカバーし、エンジン横断のゲームデザイナー・レベルデザイナー・テクニカルアーティストも揃っています。ゲーム制作のパイプライン全体をチームとして組める構成になっており、個人インディー開発者にとって特に有用です。


実用性に限界がある領域

実行環境との依存が高いエージェント

Sales Data Extraction Agent(Excelファイルの監視・指標抽出)や Report Distribution Agent(レポートの自動配信)のような自動化エージェントは、Claude Codeのようなコーディングアシスタントの文脈では機能しますが、独立した自律エージェントとして動かすにはn8nやMake等の外部オーケストレーション基盤が別途必要です。あくまでシステムプロンプトであり、スケジューラーや外部API連携は自前で用意する必要があります。

金融トランザクション系エージェント

「暗号通貨・法定通貨・ステーブルコインでの自律的な支払い実行」という説明が付いている Accounts Payable Agent は、現状では安全上の理由からAIに金融トランザクションを自律実行させることは推奨されません。設計仕様書やワークフロー整備の補助として使うのが現実的です。

専門資格が必要な領域

Legal Compliance Checker(SOC 2・HIPAA・PCI-DSS)や Civil Engineer(ユーロコード・ACI・AISC対応)のエージェントは、ドキュメント整理・チェックリスト作成・ドラフト生成には優秀です。しかし法的・構造的な最終判断は有資格の専門家によるレビューが必須であり、「下書きを作る副操縦士」として使うべきです。

中国市場向けエージェント(日本からの利用)

WeChat・Douyin・Xiaohongshu等の中国プラットフォーム向けエージェントは戦略立案の質が高いですが、日本からこれらのプラットフォームへのアカウント操作やコンテンツ投稿には、プラットフォームごとのAPIアクセス権限・ICP登録・審査通過が別途必要です。


対応ツールの広さが強み

このリポジトリのもう一つの特徴は、複数のAIコーディングツールへのワンコマンドインストールに対応している点です。

# 変換スクリプトを実行
./scripts/convert.sh

# 対話的インストーラーで導入先を選択
./scripts/install.sh

対応ツールは Claude Code・GitHub Copilot・Cursor・Gemini CLI・Aider・Windsurf・Qwen Code・Kimi Code・OpenCode など11種類。自分が普段使っているツールに合わせてエージェントをそのまま流用できます。


効果的な使い方:チームとして組み合わせる

単独使用より 複数エージェントをチームとして組み合わせる ことで真価を発揮します。

たとえばスタートアップのMVP開発であれば、次のようなチームを組んでClaude Codeのセッション内でエージェントを切り替えながら作業するスタイルが想定されています。

  1. Rapid Prototyper → POCの高速生成
  2. Backend Architect → APIとDB設計
  3. Frontend Developer → React実装
  4. Reality Checker → リリース前品質ゲート
  5. Growth Hacker → ユーザー獲得戦略

まとめ:どこまで使えるか

用途 評価
Claude CodeでのPR・コードレビュー補助 ★★★★★
システム設計・アーキテクチャ相談 ★★★★★
ゲーム開発の各工程補助 ★★★★☆
マーケティング戦略の立案 ★★★★☆
テスト設計・QA ★★★★☆
中国市場向け戦略立案(実行は別途) ★★★☆☆
自律的な外部API操作・支払い処理 ★☆☆☆☆
法律・構造設計の最終判断 ★☆☆☆☆

このリポジトリの本質は「AIに専門家の文脈とルールを持たせることで、汎用的な回答ではなく、役割に特化した一貫性のある成果物を引き出す」ことにあります。特にClaude Codeを中心とした開発ワークフローに統合すると、エンジニアリング・テスト・設計の各ロールで明確な質の向上が見込めます。

一方で「エージェント=自律的に動くボット」ではなく、あくまで「高品質なシステムプロンプト集」として理解することが重要です。外部ツール連携・実際のデプロイ・金融トランザクションといった実行レイヤーは別途構築する必要があります。

144のエージェントを全部使おうとするより、自分のワークフローに直結する10〜20個を選んで深く活用するアプローチが、現時点では最も費用対効果が高いでしょう。

Discussion