pre:Invent 2023 運用関連サービスアップデート メモ
AWS re:Invent 2023 前に発表された運用系サービスアップデート(11月1日以降)をメモします。
12月1日まで書きます(予定)。
Amazon CloudWatch Container Insights の Amazon EKS オブザーバビリティを強化
Amazon CloudWatch Observability EKS add-on をクラスターにインストールすることで、EKS のオブザーバビリティが強化されるそうです。
Amazon RDS Performance Insights は、CloudWatch へのダッシュボードのエクスポートをサポート
RDS Performance Insights のメトリクスを CloudWatch ダッシュボードへエクスポート可能になりました。
Amazon EventBridge は、EventBus 用に20を超える新しい Amazon CloudWatch メトリクスをサポート
イベントの呼び出し数やレイテンシなどトラブルシューティングやサービスクォータ増加の判断に役立つメトリクスが増えました。
Amazon CloudWatch Logs が Live Tail の正規表現フィルター パターンをサポート
Live Tail は CloudWatch Logs を tail コマンドのように表示する機能です。
Amazon EventBridge Pipes に新しいロギング機能が追加され、可観測性が向上
Pipes がロギングを提供することによって、インテグレーション中の問題がソースなのかターゲットなのか Pipes なのか切り分け可能になりました。
Grafana コミュニティプラグインを使用して Amazon Managed Grafana エクスペリエンスを拡張する
Grafana の豊富なコミュニティプラグインのサポートを喜ぶ人は多いと思います。
Amazon CloudWatch Logs Insights が複数の stats コマンドをサポート
以下の例だと、最初に5分間のメッセージ総量を計算し、次に最大・最小・平均メッセージを計算しています。
FIELDS strlen(@message) AS message_length
| STATS sum(message_length)/1024/1024 as logs_mb BY bin(5m)
| STATS max(logs_mb) AS peak_ingest_mb,
min(logs_mb) AS min_ingest_mb,
avg(logs_mb) AS avg_ingest_mb
EC インスタンスと EBS ボリュームをバックアップするデフォルトポリシーを公開
細かいことを考えずにとりあえずバックアップとれます。
Systems Manager は、運用上の問題のステータス更新、変更リクエストを Amazon EventBridge にパブリッシュするようになりました
Systems Manager のイベントを EventBrige にパブリッシュすると、その後 Slack などのツールとの連携がしやすくなります。
対応しているイベントはこちら。
Amazon EventBridge event examples for Systems Manager
EBS ボリュームの健全性を監視するための EBS Stalled I/O Check と呼ばれる新しい CloudWatch メトリクスが利用可能になりました
EBS ボリューム障害を迅速に検知可能になりました。
0 が合格、 1 が失敗だそうです。
セッション情報
AWS Systems Manager Automation がいくつかのアクションをサポート
- loop
- do while または for each 形式のループが可能に
- updateVariable
- ランブック内で変数のアップデートが可能に
- ただし、型変換はできない
- outputs as inputs
- ランブックの output を定義可能に
- Using JSONPath in runbooks
- JSONPath を使ってランブック内で JSON の値を取得可能に
Athena が CloudWatch メトリクスを提供し、コンピュートリソースと使用クエリーのインサイトが可能に
使いすぎや想定外の利用が検出できるかもしれません。
Monitoring Athena queries with CloudWatch metrics
AWS Systems Manager Incident Manager が原因と思われる変更を特定できるように
Incident Manager が検知したインシデントに含まれるリソースが、CloudFormation または CodeDeploy によって直近変更されたかどうかを調べてくれるようです。
直近の変更が新しいインシデントになることはよくあります。
AWS Distro for OpenTelemetry でログ収集がサポート
ADOT Collector や OTEL SDK を使用してログを収集し CloudWatch などのバックエンドに送信できるようになりました。
Semantic Conventions に基づいたメタデータにより、ログとトレースの相関が容易になりました。
Amazon CloudWatch が AI を活用した自然言語クエリ生成を発表 (プレビュー中)
Logs Insights と Metrics Insights で生成 AI を活用した自然言語クエリの生成が可能になりました。
マネジメントコンソールに表示されているプロンプト例の一部
このプロンプトでは、過去 1 時間のすべてのクライアントの例外を一覧表示するクエリを生成できます。
List all client exceptions from the last 1 hour in my exception logs
このプロンプトでは、最新の 5 つのログパターンを一覧表示するクエリを生成できます。
List the 5 most frequent patterns in my exception logs
このプロンプトでは、請求額が最も高い Lambda 呼び出しの上位 100 件を検索するクエリを生成できます。
Return the top 100 highest billed lambda invocations
このプロンプトでは、IAM ロールまたはポリシーが変更された最新の CloudTrail イベントを検索するクエリを生成できます。
Return the most recent events with changes to IAM role or policy events
このプロンプトでは、仮想プライベートクラウドログ内の最新の 20 件の TCP リクエストを返すクエリを生成できます。
What are the 20 most recent TCP requests?
CloudWatch Logs の異常検出とパターン分析を発表
パターン分析や異常検知でログの分析がパワフルになりました。
Amazon CloudWatch Logs now offers automated pattern analytics and anomaly detection が詳しいです。
(1) 繰り返しパターン
似たようなログパターンをグルーピングしてカウントしてくれます。
タイムスタンプや数値 (レスポンスタイム、IP アドレスなど) はアスタリスクで表示されます。
(2) ログ比較
パターン化されたログを指定した期間と比較してくれます。
アクセスログやエラーログを1日前や1週間前と比較して、傾向を把握するなどの用途に使えそうです。
(3) 異常検出
特定期間でパターン化されたログのうち、出現率が急増したパターンや想定外のパターンを検出してくれます。
モニタリングに使えたら嬉しい。
Systems Manager Automation にローコードビジュアルデザインが導入され、ランブックの作成が簡単になりました
Automation は使いこなれせばとても便利なのですが、独自の YAML 構文を書かないといけないのが辛いところでした。
ビジュアルデザインが導入されたことにより、D&D で簡単にコンポーネントを配置することが可能になり、かなりとっつきやすくなりました。
CloudWatch Logs が IA クラスを発表
S3 の IA と同じ考え方だと思います。アクセス頻度が低いログを保管する用途です。
2023/11/27時点での東京リージョンのデータ取り込み料金です。
Manage Logs | Price |
---|---|
Standard | $0.76 per GB |
Infrequent Access | $0.38 per GB |
IA クラスはサポートされている機能が Standard より少なくなっています。
Log classes
同時期に発表された自然言語のクエリや異常検出、サブスクリプションフィルターなど多くの機能がサポート外です。ご注意ください。
CloudWatch が複数のソースからのデータクエリをサポート
データソースをクエリしてメトリクスを表示する機能です。
標準の CloudWatch で取得できないメトリクスをダッシュボードの一部にすることで効果を発揮しそうです。
AWS Backup がリストアテストをサポート
AWS Backup によってリカバリポイントが作成されたリソースのリストアテストをサポートしました。
リストア計画には、リストア頻度やテスト開始時間などを含めることができます。
RTO、RPO を満たしていることの確認などに使えます。
AWS Backup が EBS スナップショットアーカイブをサポート
アーカイブは低コストでリストア頻度が低く長期保管に向いています。
AWS Backup で取得した EBS スナップショットをアーカイブするで、規制要件などの長期保管に対応したバックアップ計画を作成することが可能になりました。
myApplications アプリケーションを管理するための One Place View を提供
マネジメントコンソール上でアプリケーションを管理するためのアプリケーションダッシュボードが簡単に作成できるようになりました。
タグや CloudFormation スタックなどを組み合わせることでグルーピングしているようです。
サマリー、コスト、Compute、DevOps、モニタリング、セキュリティ等の複数のウィジェットが含まれており、アプリケーションの管理や監視が容易に実現できます。
Amazon CloudWatch Application Signals プレビュー
オブザーバビリティを加速する CloudWatch 系統の新サービスプレビューです。GA が待ち遠しい。
Application Signals は以下のような利点があります。
- アプリケーションからメトリクスとトレースを自動的に収集、主要なメトリクスをダッシュボードに表示
- SLO を簡単に作成可能。SLI を追跡
- アプリケーショントポロジーマップを自動的に作成
- RUM、Synthetics Canaries、AWS Service Catalog AppRegistry と連携してダッシュボードとマップに表示
What’s new in AWS Observability at re:Invent 2023
AWS 公式ブログによるまとめです。