Enabling SREの加速をAI活用で模索する
この記事は何?
本記事は、SREとしてClaude CodeやClaude Code Actionといった生成AI技術を活用し、プロダクトチームへのEnabling活動を推進した経験をまとめたものです。プロダクトチームがインフラ・SRE領域に対して抱く心理的ハードルを下げるため、AIを用いた施策について紹介します。
あなたは誰?
株式会社グロービスのデジタルプラットフォーム部門(以下、GDP)でSite Reliability Engineerをしており、プロダクト横断的に信頼性向上に従事しています。AWS、Kubernetes環境でTerraform、Kustomizeを活用したIaC運用を推進しつつ、AIツールを活用したチーム支援・Enabling活動の実践者として活動しています。
前提・背景
私たちのSREチームは、特定のプロダクトに紐づくのではなく、組織横断的に複数のプロダクトに関わっています。SREが直接関わるプロダクトは6つあり、プロダクトごとにチーム数も異なります。そのため、SREチームがボトルネックとならないよう、「プロダクトチーム自身が、自分たちのサービスに必要なインフラを理解し、主体的に開発・運用できる状態」を理想としています。
しかし、現実にはインフラやSRE領域は専門性が高く、プロダクト開発者にとっては敷居の高い存在に感じられることがあります。「インフラって難しそう...」「どこから手をつければいいんだろう」といった不安を抱えている開発者も少なくありません。
私たちはこのギャップを埋める取り組みを継続してきましたが、今年からはAIを活用してプロダクトチームへのEnablingを加速させる新たな取り組みを開始しています。
AIツールを活用したEnabling戦略
Claude Codeによるコーディング支援の仕組み作り
多数のインフラ関連GitHubリポジトリが存在するため、リポジトリ横断的にルールを適用できるよう、以下のような構成を採用しています。具体的には、ルールをまとめた中心リポジトリと、それを参照する各プロダクト用リポジトリがあります。
標準化のためのルールを整備する
SREチームの知見を体系化・標準化するため、ルールをまとめたGitHubリポジトリ(以下、sre-ai-rule-repo)を整備しました。このリポジトリには以下の内容を収録しています。
- コーディングガイドライン: TerraformやKubernetesマニフェストの推奨実装パターン
- チーム方針: インフラ運用における基本的な考え方や判断基準
- ベストプラクティス集: 過去の経験から得られた知見の蓄積
サブモジュール化によりルール参照を可能にする
sre-ai-rule-repoを各プロダクト向けインフラリポジトリにサブモジュールとして組み込むことで、プロダクトチームが常に最新の知見を参照できる環境を構築しました。
また、各プロダクト向けインフラリポジトリに適切なCLAUDE.md
ファイルを設定することで、プロダクトチームがClaude Codeを使用する際に、既存の知見を自然に取り入れた実装ができるようになりました。
Claude Code Actionによる自動レビューの導入
コーディング実装だけでなく、PRのレビュー(特にプロダクトチームがSREにレビュー依頼をする際)においても、事前にAIによるコードレビューを実施することで、プロダクトチームの心理的障壁を下げられると考えています。Claude CodeはGitHub Actionsとシームレスに連携できるため、Claude Code Actionも導入しました。
Claude Code Actionを活用して、PR作成時に以下のような自動レビューを実施するよう設定しました。
- lintやベストプラクティスを加味した自動レビュー
- Terraform planやKustomize buildの結果要約
これにより、プロダクトチームは「この実装でいいんだろうか...」という不安を軽減しつつ、SREにレビューを依頼する前により自信を持てるようになりました。
導入アプローチ
ハンズオンを通して一緒に一歩踏み出す
AIツールの導入にあたって、「こういった仕組みをリリースしました!」といった単なるアナウンスだけでは実際に使ってもらえるキッカケにはつながりづらいと考え、プロダクトチームを巻き込んだハンズオン会を開催しました。
ハンズオン会を通してグループでの体験を通して、一人で取り組む場合より心理的ハードルが低くなり、質問がしやすい環境で第一歩を踏み出しやすいスタイルを目指しました。また、プロダクトチームに実際に使用してもらいながらフィードバックを収集することで、改善点や課題を特定し、次のアクションにつなげられるようにしました。
プロダクトチームごとに抱えるトピックが異なるため、案内はプロダクトチーム単位で実施しました。
このタイミングで丁度WAFに関するポストモーテムが開催されたため、プロダクトチームが既存のWAFルールについて理解を深める機会として活用しました。
プロダクトチームからの反応
プロダクトチームとのハンズオン会を通して、プロダクトチームからは「思ったより敷居が高くない」「自分でも取り組めそう」といった声をもらいました。
完璧な理解を求めるのではなく、「ひとまず手を動かしてみよう」というモチベーションを持てた方もいて、第一歩を一緒に踏み出すキッカケになったと感じました。
また、コーディングだけでなくAWSやKubernetesなどの知識についてもAIを通して質問できることで、それらの領域に関する疑問解消につながり、喜ばしいという反応をいただきました。
今後に向けて
AIによるコーディング・レビューサポートの仕組みを導入しましたが、この取り組みが開発効率化にどれだけ寄与しているか、またプロダクトチームの心理的障壁を実際に下げられているかを定量的に測定する必要があります。さらに、システムをより改善するための方法も把握していく必要があります。
効果測定とフィードバックのループを確立することで、導入フェーズから運用フェーズへと昇華できます。逆に言えば、このループを確立できなければ、せっかくの取り組みもやりっぱなしの施策で終わってしまうでしょう。
また、SREチーム自身がAIツール活用のスキルを向上させることで新たな効率化の糸口が見えてくるため、チーム内でのスキル向上も重要な課題です。
「プロダクトチーム自身が、自分たちのサービスに必要なインフラを理解し、主体的に開発・運用できる状態」を目指し、引き続き組織を巻き込んで取り組んでいきたいです。
Discussion