Open6
性能監視、稼働統計、トラブル時にみるべき稼働統計は?

① 監視目的の設定:何のための性能監視なのか「目的」をはっきりさせる。
② 監視対象の選定:「目的」を達成するために、何を監視すべきか検討する。
③ 監視項目の決定:②で検討した監視対象が、どの機器に必要なのかを検討する。

性能監視、死活監視、ログ監視というキーワードがあるっぽいので整理したほうがよき。
・性能監視:リソース監視とも呼ばれており、サーバーのCPU、メモリー、ディスクの状態やトラフィック
・死活監視:サーバーやネットワーク機器などのノードが稼働しているか否かを監視
・ログ監視:ノードの挙動が記録されたログを監視する
<参考サイトやで>

そもそもなんで性能監視が必要なのか?
・障害の予兆となりうる異常を検知するため
・障害が起きた際に、すばやく状態を把握するため

以下サイトがめちゃわかりやすい。
<システム監視における監視項目をわかり易く解説>
<死活監視から性能監視、そして性能管理へ>

・キーワード
性能監視 項目
性能監視 とは

あとは自宅にある本を読んで、監視する意味やボトルネックになりやすい項目、トラブルになりやすいのはなんなのかを勉強していみる。本屋でも見てみよう。
どっちかというと、Zabbixを使った監視を実際に実機使って触ったほうがいいと思う。
そのほうが勉強になるし、いざ実装する際にも楽。
あとはAWSの機能とかも。コンテナ側としてどこまで責任持つのか。