🕌

Googleのエージェント2エージェント(A2A)プロトコル

に公開

エージェント相互運用性の新時代

AIエージェントは、日常の反復的なタスクや複雑なタスクを自律的に処理することで、生産性向上を支援する独自の機会を提供しています。現在、企業はますます自律型エージェントを構築・展開して、職場全体でのプロセスのスケーリング、自動化、強化を支援しています—新しいラップトップの注文から、カスタマーサービス担当者の支援、サプライチェーン計画の支援まで。

AIエージェントの利点を最大化するためには、これらのエージェントがサイロ化されたデータシステムやアプリケーションを横断して、動的なマルチエージェントエコシステムで協力できることが重要です。異なるベンダーや異なるフレームワークで構築されたエージェント同士が相互運用できるようにすることで、自律性が高まり、生産性の向上が倍増し、長期的なコストが削減されます。

https://github.com/google/A2A

A2Aプロトコルの紹介

Googleは、50以上のテクノロジーパートナーの支援と貢献により、Agent2Agent(A2A)と呼ばれる新しいオープンプロトコルを立ち上げました。このプロトコルにより、AIエージェントは相互に通信し、安全に情報を交換し、様々な企業プラットフォームやアプリケーション上でアクションを調整することができます。

A2Aプロトコルは、AIエージェントが基盤となる技術に関係なく、シームレスに協力して複雑な企業ワークフローを自動化し、効率性とイノベーションの前例のないレベルを推進する未来に向けた共通のビジョンを示しています。これはAnthropicのModel Context Protocol(MCP)を補完するオープンプロトコルで、エージェントに有用なツールとコンテキストを提供します。

A2Aの設計原則

A2Aは、基盤となるフレームワークやベンダーに関係なく、エージェント同士が協力するための標準的な方法を提供するオープンプロトコルです。パートナーとともにプロトコルを設計する際、5つの重要な原則に従いました:

  1. エージェント機能の活用: A2Aは、メモリ、ツール、コンテキストを共有していなくても、エージェントが自然で非構造化されたモダリティで協力できるようにすることに焦点を当てています。エージェントを「ツール」に限定せずに、真のマルチエージェントシナリオを可能にしています。

  2. 既存の標準に基づく構築: このプロトコルは、HTTP、SSE、JSON-RPCなどの既存の一般的な標準の上に構築されており、企業が日常的に使用している既存のITスタックとの統合が容易になっています。

  3. デフォルトでセキュア: A2Aは、エンタープライズグレードの認証と認可をサポートするように設計されており、ローンチ時にはOpenAPIの認証スキームと同等のセキュリティを提供します。

  4. 長時間実行タスクのサポート: A2Aは柔軟に設計されており、短時間のタスクから、人間が介在する場合に何時間、あるいは数日かかる可能性のある詳細な調査まで、様々なシナリオをサポートします。このプロセス全体を通じて、A2Aはユーザーにリアルタイムのフィードバック、通知、状態更新を提供できます。

  5. モダリティに依存しない: エージェントの世界はテキストだけに限定されていないため、A2Aは音声やビデオストリーミングなど、様々なモダリティをサポートするように設計されています。

A2Aの仕組み

A2Aは「クライアント」エージェントと「リモート」エージェント間のコミュニケーションを促進します。クライアントエージェントはタスクを作成して伝達する責任があり、リモートエージェントはそれらのタスクに対応して、正確な情報を提供するか、正しいアクションを取る責任があります。この相互作用には、以下のような重要な機能が含まれます:

  1. 機能の発見: エージェントはJSON形式の「エージェントカード」を使用して自身の機能を公開し、クライアントエージェントがタスクを実行できる最適なエージェントを特定し、A2Aを活用してリモートエージェントと通信できるようにします。

  2. タスク管理: クライアントとリモートエージェント間のコミュニケーションは、エンドユーザーのリクエストを満たすためにエージェントが作業するタスク完了に向けられています。この「タスク」オブジェクトはプロトコルによって定義され、ライフサイクルを持っています。それは即座に完了することも、長時間実行タスクの場合は、各エージェントが通信してタスク完了の最新状況を互いに同期させることもできます。タスクの出力は「アーティファクト」として知られています。

  3. コラボレーション: エージェントはコンテキスト、返信、アーティファクト、またはユーザー指示を伝達するためにメッセージを送り合うことができます。

  4. ユーザーエクスペリエンスの交渉: 各メッセージには「パーツ」が含まれており、これは生成された画像のような完全に形成されたコンテンツです。各パーツには指定されたコンテンツタイプがあり、クライアントとリモートエージェントが必要な正しいフォーマットを交渉し、iframeやビデオ、ウェブフォームなどのユーザーUIの能力の交渉を明示的に含めることができます。

A2Aの未来

A2Aは、エージェントの相互運用性の新時代を切り開き、イノベーションを促進し、より強力で多用途なエージェントシステムを創出する可能性を秘めています。このプロトコルは、エージェントが複雑な問題を解決し、私たちの生活を向上させるためにシームレスに協力できる未来への道を開くと信じています。

Googleは、パートナーとコミュニティと協力してオープンな形でプロトコルを構築することに取り組んでいます。プロトコルをオープンソースとして公開し、貢献のための明確な経路を設定しています。今年後半には、パートナーと協力してプロトコルの本番対応版の提供を目指しています。

Discussion