💡

AWS DevOps Agent と Azure SRE Agent で変わるオンコールの未来

に公開

2025 年 12 月 3 日 (現地時間 12 月 2 日)、AWS re:Invent で「AWS DevOps Agent」が発表されました[1]。同年 5 月の Microsoft Build では「Azure SRE Agent」が先行発表されており[2]、クラウド大手 2 社が同時期に AI 運用エージェントを投入したことになります。

https://docs.aws.amazon.com/devopsagent/latest/userguide/what-is.html

https://learn.microsoft.com/en-us/azure/sre-agent/overview?tabs=task

どちらもインシデント対応の自動化を目指していますが、アプローチには違いがあります。この記事では、両エージェントの機能を比較しながら、それぞれの特徴を整理してみます。

機能比較: 何ができて、何と繋がるか

両エージェントの主な違いを表にまとめました。

観点 AWS DevOps Agent Azure SRE Agent
発表時期 2025 年 12 月 (re:Invent) 2025 年 5 月 (Build)
ステータス パブリックプレビュー パブリックプレビュー (課金は 2025 年 9 月開始)
動作モデル 長時間自律動作 Review / Autonomous の 2 モード
ネイティブ監視 CloudWatch Azure Monitor, Application Insights
CI/CD 連携 GitHub, GitLab GitHub, Azure DevOps
通知・調整 Slack, ServiceNow Teams, Outlook, ServiceNow, PagerDuty
拡張性 MCP サーバー BYO サブエージェントビルダー, MCP コネクタ
予防機能 週次自動評価 (4 領域) スケジュールタスク
料金 プレビュー中は無料 4 AAU/時間 + アクション課金

なお、サードパーティ製監視ツール (Datadog, Dynatrace, New Relic) は両方でサポートされています。MCP を通じた拡張も両者共通です。

自律性のレベル

AWS は DevOps Agent を「Frontier Agent」に位置付けています。これは、人間の継続的な監視なしに、数時間から数日間自律動作できるエージェントという AWS での定義です[3]。アラートを受け取ると自動で調査を開始し、Slack に進捗を投稿しながら根本原因を追跡します。

一方で、Azure SRE Agent は 2 つのモードを選択できます[4]。「Review」モードでは診断結果と推奨アクションを提示し、実行には人間の承認が必要です。「Autonomous」モードでは緩和策まで自律的に実行しますが、これはインシデント対応プランで明示的に有効化した場合のみ動作します。

インシデント予防

AWS は週次で自動評価を実行し、監視設定・テストカバレッジ・コード品質・インフラ構成の 4 領域で改善提案を行います[5]。「このログにアラートを設定すべき」「この関数のエラーハンドリングを改善すべき」といった具体的な推奨が得られます。

Azure はスケジュールタスク機能で定期的なヘルスチェックやコンプライアンススキャンを設定できます[6]。自然言語で「毎日午前 9 時に」と指定するだけで cron 式に変換されるのは便利です。

調査アプローチ

両エージェントとも、仮説ベースの根本原因分析を行い、調査過程を可視化します。AWS DevOps Agent はテレメトリ・コード・デプロイデータを相関分析し、探索した仮説や観察結果をリアルタイムで共有しながら根本原因を特定します[7]。Web アプリで調査の進行状況を確認でき、チャットで「どのログを分析したか」と質問したり、追加のコンテキストを与えて調査を誘導したりできます。


AWS DevOps Agent の調査ダッシュボード: https://aws.amazon.com/jp/blogs/aws/aws-devops-agent-helps-you-accelerate-incident-response-and-improve-system-reliability-preview/

Azure SRE Agent の「Deep Investigation」も同様の仮説駆動型アプローチです[8]。2〜4 つの高レベル仮説(データベース負荷、ネットワークレイテンシ、構成ドリフトなど)を生成し、各仮説を反復的に検証します。有効な仮説はサブ仮説に分解して深掘りし、無効な仮説も「何を除外したか」として記録されます。


Azure SRE Agent の自動調査モード: https://techcommunity.microsoft.com/blog/azurepaasblog/introducing-azure-sre-agent/4414569

セキュリティモデル

運用エージェントにインフラへのアクセス権を与える以上、セキュリティは重要な関心事です。両者とも RBAC、暗号化、監査ログ、プロンプトインジェクション対策といった基本要件は満たしています[9][10]

違いがあるのは書き込み操作への姿勢です。AWS は読み取り専用を推奨し、書き込みはチケット作成程度に限定する設計です。Azure は Review モードで同意フローを挟みつつ、書き込み操作も許可するアプローチを取っています。なお、両者ともプレビュー段階なので、通常の製品に対するセキュリティコンプライアンスが適用されるかは要確認の状態です。

思想の考察

両社のアプローチには、思想の違いも少し見えます。

AWS DevOps Agent は、「Frontier Agent」という言葉を前面に押し出し、長時間自律動作+人間の監視が要らないということを強調しているように見えます。一方、Azure SRE Agent は人間の介入を前提としたモデルを用意しており、既存のワークフローとのハレーションを起こさないための、ソフトランディングな導入を目指していそうな雰囲気があります。

ただし、それ以外の点についてはおおむね同じような方向性だといえるでしょう。両エージェントとも MCP や外部監視ツール連携を通じて、マルチクラウドやオンプレミス環境のリソースにアクセスできます。AWS では「BYO (Bring Your Own) MCP サーバー」を前面に、オープンなエコシステムとの接続を強調しています[11]。Azure も「on-premises and SaaS systems」との統合を明示しており、Azure 専用というわけではないことを謳っています。

どちらを選ぶ?

正直なところ、使っているクラウドプラットフォームが選択を決めることになるでしょう。AWS 上で Azure SRE Agent を使う(またはその逆)ことは想定されていません。

その上で、プラットフォーム以外の判断ポイントを挙げるとすれば:

  • CI/CD 環境: GitLab を使っているなら AWS、Azure DevOps を使っているなら Azure
  • コミュニケーションツール: Slack 中心なら AWS、Teams/Outlook 中心なら Azure
  • コスト: まずは無料で試したいなら AWS (プレビュー期間中)
  • 拡張性: サブエージェントで組織固有のワークフローを構築したいなら Azure

AI とオンコールの共存

両エージェントとも、オンコールエンジニアを「代替」するわけではありません。緩和策の実行には人間の承認が必要ですし、複雑な判断やステークホルダーとのコミュニケーションは依然として人間の仕事です。

変わるのは、人間の役割です。ログを漁り、メトリクスを突き合わせ、仮説を立てる作業をエージェントが担い、人間は判断と承認に集中できるようになります。「調査員」から「意思決定者」へのシフトといえるかもしれません。

AWS は今後のリリースで、コードバグの検出やテストカバレッジの改善提案も追加すると予告しています[12]。インシデント対応だけでなく、予防的な品質改善にも AI エージェントが関わっていきそうです。

脚注
  1. AWS DevOps Agent helps you accelerate incident response and improve system reliability (preview) - AWS News Blog, 2025 年 12 月 2 日 ↩︎

  2. Introducing Azure SRE Agent - Microsoft Tech Community, 2025 年 5 月 20 日 ↩︎

  3. Frontier agents - 「Frontier agents are autonomous systems that work independently to achieve goals, scale massively to tackle concurrent tasks, and run persistently for hours or days without intervention.」 ↩︎

  4. Agent run modes - Azure SRE Agent ↩︎

  5. Preventing future Incidents - AWS DevOps Agent - 4 領域は Observability posture、Testing gaps、Code changes、Infrastructure architecture ↩︎

  6. Scheduled tasks in Azure SRE Agent - 「you can select the Draft the cron for me to have the portal turn your description into a cron expression」 ↩︎

  7. DevOps Agent incident response - 「AWS DevOps Agent integrates with observability tools, code repositories, and CI/CD pipelines to correlate and analyze telemetry, code, and deployment data sharing its explored hypotheses, observations, findings, and root cause findings.」 ↩︎

  8. Use deep investigation in Azure SRE Agent - 「Deep investigation uses a hypothesis-driven approach that goes beyond surface-level checks. Instead of stopping at the first plausible explanation, the agent systematically explores and validates multiple possibilities.」 ↩︎

  9. AWS DevOps Agent Security - Agent Space による分離、プロンプトインジェクション対策、データ保護について詳述 ↩︎

  10. Roles and permissions overview - Azure SRE Agent ↩︎

  11. Connecting MCP Servers - AWS DevOps Agent ↩︎

  12. AWS News Blog より - 「In an upcoming quick follow-up release, the agent will expand its analysis to include code bugs and testing coverage improvements.」 ↩︎

Discussion