📹
監視だけでなくオブザーバビリティも
概要
2つがごっちゃになることがたまにあるのでまとめてみます。
また、オブザーバビリティはモニタリングの上位概念であるように誤解されがちですが、厳密にそれは正しくないと筆者は思っております。
モニタリングとは
サーバーのCPUやメモリ、Webアクセスの失敗・ログに出力されるエラーなど、事前に想定できる範囲で、しきい値を活用することで異常を検知して通知すること。
モニタリングでは何が不足しているのか?
事前に想定できない異常をどう把握すればよいのか?
「しきい値に引っかからない = 異常がない」と本当に言えるのか?
そこでオブザーバビリティ
オブザーバビリティは、システム状態のリアルタイムに把握して理解するために技術。
想定外の問題が起きた時には、収集されたデータを詳しく調べてシステムに何が起きたかリアルタイムに把握ができます。
また、サービス全体を可視化することにより、開発者が想定していなかった異変に早期に気づき、それがなぜ起きたのかを解析や品質の向上に取り組むことができます。
まとめ
監視は、事前に想定できる範囲の異常をアラートとして検知すること。
オブザーバビリティは、システムで何が起きているのかを把握するより調査的なアプローチのこと。
参考
Discussion