😕

#AWS EKSの障害時対応方法を考える-2

2021/03/09に公開

はじめに

#AWS EKSの障害時対応方法を考える-1の続きです。

ログをみる

さて前回まででcloudwatchでログをみれるようにしました。しかしそのままだとあんまり意味がないのでQueryでフィルターをしていきたいと思います。

  1. やりたいこと
  • namespace単位でログを見る
    アプリケーションの障害を見るためにアプリごとに論理的に区切られた空間であるnamespaceをみてログを統合的にとる方法を考えます。

結論 cloudwatch insigtsすごい

結果を言うとつかったのはcloudwatch insigtsです。これをつかってログをnamespace単位でフィルターしていきます。

該当クエリ

fields @timestamp, @log, @logStream, @message
| filter kubernetes.namespace_name = "default"
| sort @timestamp desc
| limit 100

シンプルに絞り込みしているだけですが・・・namespace単位ででるようになりました。
今後複雑な要件が出てくればathenaに移行してもよさそうです。
この仕掛けを作成しておけば、アプリ起因のエラーは検知できそうですね・・・
次は実際に起こして検知してみるところかathenaに移行するところを記載しようと思います。

参考

Amazon cloud watch logsとは(公式)

Discussion