😕
#AWS EKSの障害時対応方法を考える-2
はじめに
#AWS EKSの障害時対応方法を考える-1の続きです。
ログをみる
さて前回まででcloudwatchでログをみれるようにしました。しかしそのままだとあんまり意味がないのでQueryでフィルターをしていきたいと思います。
- やりたいこと
- namespace単位でログを見る
アプリケーションの障害を見るためにアプリごとに論理的に区切られた空間であるnamespaceをみてログを統合的にとる方法を考えます。
結論 cloudwatch insigtsすごい
結果を言うとつかったのはcloudwatch insigtsです。これをつかってログをnamespace単位でフィルターしていきます。
該当クエリ
fields @timestamp, @log, @logStream, @message
| filter kubernetes.namespace_name = "default"
| sort @timestamp desc
| limit 100
シンプルに絞り込みしているだけですが・・・namespace単位ででるようになりました。
今後複雑な要件が出てくればathenaに移行してもよさそうです。
この仕掛けを作成しておけば、アプリ起因のエラーは検知できそうですね・・・
次は実際に起こして検知してみるところかathenaに移行するところを記載しようと思います。
Discussion