🔧
EventTimerとLoss of signalで不定期なイベントに対するAlertを設定する
概要
NewRelic Alertにて、不定期なイベント(例 エラー率)を検知してIssueの開閉をする場合のTips。
基本的には参考にある公式リファレンス・ブログにある通りだが、備忘も兼ねて書く。
要約
- 不定期なイベントの結果を条件としたい場合、EventFlowではIssueが自動クローズされない場合がある
- EventTimerとLoss of signal(Close all current open incident)を使用することで、自動クローズ設定ができる
NewRelicにおけるアラートについて
アラートに関連するコンポーネントは アラート条件を正しく設定するための詳細ガイド のブログが分かりやすい。
EventFlowとEventTimerの違い
細かい点はリファレンスを見るとして、集計ウィンドウが閉じられる条件に違いがある。
EventFlowは後続データをトリガーとする一方、EventTimerは最後に到着したデータからのカウントダウンをトリガーとする。
クローズの種類
自動クローズと強制クローズがある(仮名)。
自動クローズはIssueの条件によって非違反をトリガーとする一方、強制クローズはIssue単位で設定する経過時間をトリガーとする。
EventTimerとLoss of signal
自動復旧の判定は、アラート条件のWHERE句に該当するデータが継続して発生しており、クエリの結果として正常な状態であると判断できることが前提となります
EventFlowが適したケースでは自動クローズが正常に動作するが、EventTimerが適したケースである不定期データを対象とする場合は正常に動作しないケースがある。
EventTimerは不定期なイベントの結果でモニタリングしたい場合に使われるが、そのアラートがクローズされるのはシグナルが消失した場合と言える(イベントが入ってこない)。
Loss of signalはシグナルの消失を検知し、対象のIssueを自動でクローズすることができるため、EventTimerと併用することで自動クローズを実現できる。
参考
- https://newrelic.com/jp/blog/how-to-relic/understand-nrql-alert-condition
- https://newrelic.com/jp/blog/nerdlog/new-aggregation-methods-for-nrql-alert-conditions
- https://newrelic.com/jp/blog/how-to-relic/details-of-loss-of-signal
- https://docs.newrelic.com/jp/docs/alerts-applied-intelligence/new-relic-alerts/alert-incidents/how-alert-condition-incidents-are-closed/
Discussion