ECSのタスク急死を通知したい人のデバッグを楽にする一手間

commits1 min read読了の目安(約700字

TL;DR

  • EventBridge - SNS - Chatbot - Slack で通知できます
  • EventBridge のデバッグのコツは先にゆるゆるの Rule を作ること

どうやるの?

先に ECS Task に関するイベントを全て観測できるゆるゆる Rule を作ってしまいます。

ポイント: ECS Task の急死はユーザーが API を叩いた結果ではないので、CloudTrail の Event History ではデバッグできません。

こんなにゆるゆるです。
ECS に関するイベントを貪欲に集めて、CloudWatch Logs に吐き出します。

イベントパターンはこちら。

{
  "source": ["aws.ecs"],
  "detail-type": [
    "ECS Task State Change",
    "ECS Container Instance State Change"
  ]
}

たくさんログが出てますね。嬉しい!

おまけ

起動後 3 秒で失敗する Docker イメージです。デバッグにお役立てください。

FROM bash:5.1.4
CMD [ "bash", "-c", "sleep 3; exit 1" ]