Open5
監視ツールを使う目的を書き溜めてみる
New Relicのホワイトペーパーから学ぶ
参考:Amazon Web Services (AWS) のためのNew Relic
何を可視化するか
- 設定変更を可視化する
- Amazon EC2の稼働状況を可視化する
- AWSサービスの費用を追跡する
可視化の結果どうなるか
- 平均検出時間(MTTD/mean time to detection)が低減される
- 平均復旧時間(MTTR/mean time to resolution)が低減される
- EC2の可視化によりリソースの利用効率をUPできる
- AWSサービスの費用の状況から今後の成長を予測できるようになる
どのような仕組みが提供されるか
- ダイナミックアラート
- ダッシュボード
監視種別を書き出してみる
- 死活監視
- サービス・プロセス監視
- ログ監視
- SNMP監視
- URL監視
- パフォーマンス監視
整理するなら、「監視種別」「監視項目」「監視の目的」あたりを並べて上げるとわかりやすいかもしれない。
監視を構成する機能を書き出してみる
- データを取得する機能
- データを分析する機能
- 異常を検知する機能
- 異常を通知する機能
- 異常に対するアクションを行う機能
- データを可視化(グラフや統計データを提供)する機能
- ダッシュボードの機能
- レポートの機能
監視を分類する切り口
参考:NewRelic / Elasticsearch ではじめるSREに必要な性能監視入門 - Speaker Deck
「監視対象」と「監視目的」でわけるというアイデアはわかりやすいように思う。
- 監視対象ごとの切り口
- 監視目的ごとの切り口
Datadog:AWS 監視のための主要なメトリクス
参考:AWS 監視のための主要なメトリクス | Datadog
Amazon EC2、Amazon EBS、Amazon ELB、Amazon RDS、Amazon ElastiCache、AWS Lambdaを例に挙げ、どのようなメトリクスを監視すべきか述べられている。