この記事は<a href="https://qiita.com/advent-calendar/2024/jaws-ug" target="_blank" rel="nofollow noopener noreferrer">JAWS-UG（AWS Users Group – Japan） Advent Calendar 2024</a>の17日目の記事です。
<h1 id="%E3%81%AF%E3%81%98%E3%82%81%E3%81%AB" data-line="2" class="code-line">
<a class="header-anchor-link" href="#%E3%81%AF%E3%81%98%E3%82%81%E3%81%AB" aria-hidden="true"></a> はじめに</h1>
12/1-12/6に行われたre:Invent2024にて、とあるアップデートが発表されました。 
それが、<a href="https://aws.amazon.com/about-aws/whats-new/2024/12/amazon-q-developer-operational-investigation-preview/" target="_blank" rel="nofollow noopener noreferrer">こちら</a>のAmazon Q Developerが運用調査機能を追加(プレビュー)というものです。
このタイトルだけではあまりイメージが付きにくいかと思いますが、実は結構面白くてインパクトのある内容です。なので簡単に現時点(2024/12/15　プレビュー段階)での機能をご紹介したいと思います。 
今後のAWS運用が大きく変わるかもしれません。
<h1 id="amazon-q-developer%E3%81%A8%E3%81%AF" data-line="9" class="code-line">
<a class="header-anchor-link" href="#amazon-q-developer%E3%81%A8%E3%81%AF" aria-hidden="true"></a> Amazon Q Developerとは</h1>
ここでは説明不要かもしれませんが、簡単に。 
re:Invent2023でプレビュー発表された、AWSによる生成AIアシスタント機能の総称です。今年のre:InvnetではこのAmazon Q Developerに関するアップデートが、CEO Keynoteでも多数発表されていました。
<iframe src="https://www.youtube-nocookie.com/embed/LY7m5LQliAo" allow="accelerometer; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen loading="lazy"></iframe><a href="https://www.youtube.com/watch?v=LY7m5LQliAo" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://www.youtube.com/watch?v=LY7m5LQliAo</a>
以下は一例です。
<ul data-line="16" class="code-line">
<li data-line="16" class="code-line">Unit Test作成</li>
<li data-line="17" class="code-line">ドキュメント作成</li>
<li data-line="18" class="code-line">コードレビュー</li>
</ul>
など多数の、開発者アシスタントとしての機能が発表されています。 
これらの機能については他の方も多数記事にしていただいているので、そちらを参照いただくのが良いかと思います。
<iframe id="zenn-embedded__76aa4d93c38c7" src="https://embed.zenn.studio/card#zenn-embedded__76aa4d93c38c7" data-content="https%3A%2F%2Fqiita.com%2Fyoshimi0227%2Fitems%2F336d2d1d9cd50c050754" frameborder="0" scrolling="no" loading="lazy"></iframe><a href="https://qiita.com/yoshimi0227/items/336d2d1d9cd50c050754" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://qiita.com/yoshimi0227/items/336d2d1d9cd50c050754</a>
<iframe id="zenn-embedded__fcef2171bda86" src="https://embed.zenn.studio/card#zenn-embedded__fcef2171bda86" data-content="https%3A%2F%2Fqiita.com%2Fhar1101%2Fitems%2Fb303e9105b29b9bdd525" frameborder="0" scrolling="no" loading="lazy"></iframe><a href="https://qiita.com/har1101/items/b303e9105b29b9bdd525" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://qiita.com/har1101/items/b303e9105b29b9bdd525</a>
そんな中、AWSでのOperationに関わるセッション(Building the Future of cloud operations at any scale(COP202))で紹介されていたのが、今回ご紹介するAmazon Q Developer adds operational investigation capabilityです。 
このセッションはYoutubeにも公開されているので、こちらも見ていただきつつ、このセッションサマリーはAWSさんからブログとしても発表されています(日本語訳もしてくださっています。)。
<iframe src="https://www.youtube-nocookie.com/embed/iT3er0h06Dk" allow="accelerometer; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen loading="lazy"></iframe><a href="https://www.youtube.com/watch?v=iT3er0h06Dk" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://www.youtube.com/watch?v=iT3er0h06Dk</a>
<iframe id="zenn-embedded__9cdfe02d3593a" src="https://embed.zenn.studio/card#zenn-embedded__9cdfe02d3593a" data-content="https%3A%2F%2Faws.amazon.com%2Fjp%2Fblogs%2Fnews%2Ftop-announcements-for-aws-cloud-operations-at-reinvent-2024%2F" frameborder="0" scrolling="no" loading="lazy"></iframe><a href="https://aws.amazon.com/jp/blogs/news/top-announcements-for-aws-cloud-operations-at-reinvent-2024/" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://aws.amazon.com/jp/blogs/news/top-announcements-for-aws-cloud-operations-at-reinvent-2024/</a>
<h1 id="%E3%81%A9%E3%82%93%E3%81%AA%E3%82%82%E3%81%AE%EF%BC%9F" data-line="35" class="code-line">
<a class="header-anchor-link" href="#%E3%81%A9%E3%82%93%E3%81%AA%E3%82%82%E3%81%AE%EF%BC%9F" aria-hidden="true"></a> どんなもの？</h1>
一言でいうと、AWS上での障害調査を、AIが関連情報を提案しながら、よりスピーディに解決まで伴走してくれる機能です。
これまでAWS上で障害が発生した場合、CloudWatch Alarmがトリガーされユーザーに通知が来ます。そこからアラームの元となったメトリクスやログを追い、必要に応じてサーバーへのログインやECSサービスの切り戻しなどを行っていたと思います。
今回のアップデートでは、Alarmがトリガーされた時に自動で関連するメトリクスやログを提示するだけでなく、テレメトリやデプロイメント、AWS Healthイベントなどを含めAWS全体のデータを元に、障害の根本原因を解決するために必要なデータを提示してくれるという素晴らしい機能が発表されました。 
さらにこれに付随して、障害調査の記録をマネジメントコンソール上で残すことができます。Amazon Qが提示した情報が正しければ、それを障害調査記録としてワンクリックで調査記録として保存できます。
現状はバージニア北部リージョン(us-east-1)でのみ、プレビュー利用が可能です。また、ワークロードがなくても、サンプルとして調査アシスタントの機能を実行することが可能です。
<h1 id="%E8%A7%A6%E3%81%A3%E3%81%A6%E3%81%BF%E3%82%8B" data-line="46" class="code-line">
<a class="header-anchor-link" href="#%E8%A7%A6%E3%81%A3%E3%81%A6%E3%81%BF%E3%82%8B" aria-hidden="true"></a> 触ってみる</h1>
今回は簡単に触ってみた点をまとめていこうと思います。
<h2 id="%E3%82%B5%E3%83%B3%E3%83%97%E3%83%AB%E6%93%8D%E4%BD%9C" data-line="49" class="code-line">
<a class="header-anchor-link" href="#%E3%82%B5%E3%83%B3%E3%83%97%E3%83%AB%E6%93%8D%E4%BD%9C" aria-hidden="true"></a> サンプル操作</h2>
まずはサンプルの調査対応を見てみます。 
バージニア北部にてCloudWatchのサービスページに遷移します。AIオペレーション機能が追加されているのが分かります。
<img src="https://storage.googleapis.com/zenn-user-upload/116ed1878332-20241215.png" loading="lazy" class="md-img">
この右側の<code>Try a sample investigation</code>を選択するとサンプル調査シナリオを体験することができます。以下サンプルです。
<img src="https://storage.googleapis.com/zenn-user-upload/a9bf62056a98-20241215.png" loading="lazy" class="md-img">
右側のパネルがQ Developerの提示した障害に関係のあるメトリクスや操作記録になっています。
ここから分かるのは一定期間DynamoDBのスロットリングが起きていて、その原因として提示されているのが、<code>Observation for AWS DynamoDB Deployment</code>でDynamoDBに対して変更が行われた記録です。これが根本原因として正しければ、右側のパネルの<code>Accept</code>をクリックすると左側の記録に<code>Feed</code>として追加されます。
<img src="https://storage.googleapis.com/zenn-user-upload/16a68e04fc3d-20241215.png" loading="lazy" class="md-img">
<h2 id="%E6%9C%89%E5%8A%B9%E5%8C%96" data-line="66" class="code-line">
<a class="header-anchor-link" href="#%E6%9C%89%E5%8A%B9%E5%8C%96" aria-hidden="true"></a> 有効化</h2>
実際にアカウントで機能を利用するためには、アカウントで機能を有効化する必要があります。
<img src="https://storage.googleapis.com/zenn-user-upload/116ed1878332-20241215.png" loading="lazy" class="md-img">
<code>Configure for this account</code>から設定していきます。
<img src="https://storage.googleapis.com/zenn-user-upload/9c053d6ec3eb-20241215.png" loading="lazy" class="md-img">
ロググループの設定やログの保持期間、ユーザーのアクセス権限を設定します。が、今回はデフォルトで進めます。
<img src="https://storage.googleapis.com/zenn-user-upload/ca7c19e81698-20241215.png" loading="lazy" class="md-img">
<img src="https://storage.googleapis.com/zenn-user-upload/3f46b995bb48-20241215.png" loading="lazy" class="md-img">
Amazon Q DeveloperへのIAM権限や、管理するアプリケーションのタグ選択、CloudTrailイベントを統合するか、X-Rayを利用した全体マッピング、AWS Healthとの統合を設定します。
<img src="https://storage.googleapis.com/zenn-user-upload/0e003c59b24f-20241215.png" loading="lazy" class="md-img">
チケットシステムとの統合も可能です。現状はJiraとServiceNowが選択可能です。
<img src="https://storage.googleapis.com/zenn-user-upload/4c803eae8489-20241215.png" loading="lazy" class="md-img">
また、SNSと統合することでChatbotを利用して通知から調査の連携が可能になっています。 
これでアカウントで利用するまでの設定は完了です。
<h2 id="%E6%A4%9C%E8%A8%BC" data-line="93" class="code-line">
<a class="header-anchor-link" href="#%E6%A4%9C%E8%A8%BC" aria-hidden="true"></a> 検証</h2>
今回検証用に利用するのはOpsJAWSでApplication Signalsハンズオンを実施した際の<a href="https://github.com/YoshiiRyo1/opsjaws-application-signals-handson/tree/mainhttps://github.com/YoshiiRyo1/opsjaws-application-signals-handson/tree/main" target="_blank" rel="nofollow noopener noreferrer">リポジトリ</a>です。
任意のメトリクスがアラート状態になるようなCloudWatchアラームを作成します。 
アラームアクションに<code>調査アクション</code>という項目があるので、ここに作成した調査グループを設定します。
<img src="https://storage.googleapis.com/zenn-user-upload/c27b8aefde1e-20241215.png" loading="lazy" class="md-img">
アラーム状態になるとInvestigationsにOpen状態のものが作成されます。
<img src="https://storage.googleapis.com/zenn-user-upload/50ec1721ec5f-20241215.png" loading="lazy" class="md-img">
<img src="https://storage.googleapis.com/zenn-user-upload/6dca651da786-20241215.png" loading="lazy" class="md-img">
開いてみると、現状はまだ何もSuggestされていません。
<img src="https://storage.googleapis.com/zenn-user-upload/388483f28e75-20241215.png" loading="lazy" class="md-img">
Amazon Q logsを開いてみると、このアラームが設定されてからQがどのような調査をしたかを確認することができます。 
各サービスに対して関連するメトリクスを調査している様子が分かります。
<img src="https://storage.googleapis.com/zenn-user-upload/5a96ef96bbe2-20241215.png" loading="lazy" class="md-img">
QからのSuggestが全然来ないので、若干今回の例は悪かったかもしれません。
メトリクス側からInvestigatonに追加することも可能です。 
X-Rayの画面からメトリクスを選択し、<code>既存の調査に追加</code>を選択するとInvestigation側にFeedが追加されています。他にもCloudWatchアラームからも<code>既存の調査に追加</code>するためのプルダウンが存在するので、こちらからもFeedに追加していくことができます。 
また、<code>Add note</code>からコメントを追加することもできるので、障害調査の記録を全て時系列順にまとめていくことができます。
<img src="https://storage.googleapis.com/zenn-user-upload/9d4f588b7e35-20241215.png" loading="lazy" class="md-img">
<img src="https://storage.googleapis.com/zenn-user-upload/eff0ffe71c9b-20241215.png" loading="lazy" class="md-img">
こうすることで、これまでチームごとに障害調査の記録を残す方法がSlackやナレッジツールに散らばることがなく、かつ、メトリクス情報も簡単に残しながらAWSで完結することができます。 
これによってナレッジツールとしてAWSを活用するような利用方法も考えられます。
<h2 id="%E9%80%9A%E7%9F%A5%E6%83%85%E5%A0%B1" data-line="130" class="code-line">
<a class="header-anchor-link" href="#%E9%80%9A%E7%9F%A5%E6%83%85%E5%A0%B1" aria-hidden="true"></a> 通知情報</h2>
Slackに通知設定を入れていましたので、Slackの方でも確認ができます。
<img src="https://storage.googleapis.com/zenn-user-upload/4f3f2d533df9-20241215.png" loading="lazy" class="md-img">
さらに、Slack側からもNoteを追加することもできますが、ここはChatbotに書き込み権限が必要になるので必要に応じて権限を設定してください。ChatOpsに近い体制が取れるので設定してみてください。
<h1 id="%E6%9C%80%E5%BE%8C%E3%81%AB" data-line="138" class="code-line">
<a class="header-anchor-link" href="#%E6%9C%80%E5%BE%8C%E3%81%AB" aria-hidden="true"></a> 最後に</h1>
今回のアプリケーション例は良くなかったですが、AWS内で全ての障害調査を記録を残しながら完結するという部分はお伝えできたかと思います。 
今後は別のアプリケーションでQからSuggestしてもらえるような検証をしてみたいです。
ナレッジ管理に困っている方や、AWS以外のプラットフォームが使いにくい環境な方には非常に有益なアップデートになっているかと思いますし、スキルトランスファーが難しい障害対応に対して、Qがサポートしてくれるこのアップデートは激アツだと個人的には感じています。
ぜひ東京リージョンでのサポートとGAを待ちたいと思います。

Amazon Q Developerを使って障害調査を高速化！

Discussion