😸

AWS Health Dashboard起点のイベント駆動を考える

2023/12/09に公開

はじめに

この記事はDevOps on AWS大全の一部です。
DevOps on AWS大全の一覧はこちら

この記事ではAWS Health Dashboardに関連する内容を超詳細にまとめています。

具体的には以下流れで説明します。

  • AWS Health Dashboardとは
  • AWS Health Dashboardの活用
  • AWS Health Dashboardのベストプラクティス

AWSの区分でいう「Level 200:トピックの入門知識を持っていることを前提に、ベストプラクティス、サービス機能を解説するレベル」の内容です。

この記事を読んでほしい人

  • AWS Health Dashboardがどういうサービスか説明できるようになりたい人
  • AWS Health Dashboardを採用するときのベストプラクティスを説明できるようになりたい人
  • AWS Certified DevOps Engineer Professionalを目指している人

AWS Health Dashboardとは

AWS Health Dashboardは、AWSのサービスのステータスやイベント情報をリアルタイムで提供するサービスです。
AWSユーザーはこのダッシュボードを通じて、サービスの健全性やパフォーマンスに関する情報を把握できます。
AWS Health Dashboardで得られる情報には、サービスの障害、予定されたメンテナンス、およびその他の健康状態に関する通知が含まれます。

なお、AWS Health DashboardにはService HistoryとYour Accountの2つの区分が存在します。

Service Historyはすべてのリージョン、すべてのサービスのサービス状況を一覧で見ることができます。
いわゆる大規模障害の時に情報が更新されるのがService Historyです。

一方、Your Accountは以前までPersonal Health Dashboardと呼ばれていたサービスです。
今でも検索するとPersonal Health Dashboardで出てくるAWS公式ページがありますが、正式にはAWS Healthの中のDashboardに統合されています。

Your Accountは自アカウントに影響のあるアラートが表示されます。
例えばEC2インスタンスのリタイアメント通知やLambdaのランタイムサポート切れなどが通知されます。

AWS Health Dashboardの活用

AWS Health Dashboardを使用して、サービスに障害が発生しているかどうかをリアルタイムで把握し、迅速に対応できます。

1つ目の活用法がチャットへの通知です。

AWS Health DashboardはAmazon EventBridgeと連携することが可能です。
そのため、自アカウントに影響のある通知が来た際やリージョン障害が発生した際にEventBridge経由でLambdaを発火させ、チャットへ通知することができます。

ベストプラクティスは自動で通知に対する対応まで完了させることですが実プロジェクトでは報告して、対策を決定して、という場面も多くあります。
そこで、まずは通知を自動で受け取れるようにすることが大切です。

2つ目の活用法は自動での対応です。
すでに述べたように本来はAWS Health Dashboardの通知をもとに自動で対応し、対応完了するのがベストプラクティスです。

例えばIAMのアクセスキーが流出した場合には自動でアクセスキーを削除すべきですし、EC2インスタンスのリタイアメント通知が来たら自動でメンテナンスウインドウ内の再起動を実施すべきです。

このように作業が定型化できる通知は自動対応まで組み込むことがベストプラクティスです。
ただし、自動化するためにかかる作業量と発生頻度の天秤は必ず考えるようにしましょう。

意味なき自動化は目的なきDevOpsにつながりアンチパターンにはまります。

AWS Health Dashboardのベストプラクティス

AWS Health Dashboardのベストプラクティスは以下の通りです。

ベストプラクティス 説明
定期的なチェック 定期的にAWS Health Dashboardを確認し、障害情報や通知を適切にチェックする。
通知の設定と適切なアクション 通知の設定はユーザーごとに異なるが、重要なサービスに関する通知は受信し、迅速なアクションを取る。
EventBridgeを活用した統合 AWS Health Dashboard for Advanceを使用する場合、EventBridgeを活用して自動化された統合を検討する。

すでに述べたように、EventBridgeを活用した統合が最も大切です。
これを行うことで効率の良い運用かつ耐障害性の高い運用を実現できます。

まとめ

この記事ではAWS Health Dashboardに関連する内容を超詳細にまとめました。

  • AWS Health Dashboardとは
  • AWS Health Dashboardの活用
  • AWS Health Dashboard for Advance
  • AWS Health Dashboardのベストプラクティス

次回はEC2のステータスチェックを超詳細解説します。

Discussion