SRE Kaigi 2025に行ってきました
SRE Kaigi 2025 にオーディエンスとして参加したので、印象に残った発表などについてメモを残しておきます。
SRE, 開発, QAが協業して挑んだリリースプロセス改革
デプロイ頻度の向上と変更障害率の低減を実現するために行ってきた、開発してからデプロイするまでの工程におけるさまざまな対処についての発表でした。DBで管理しているフィーチャートグルが削除されないまま蓄積されがちなので、一定溜まったらredashを用いて自動通知している、といったtips的な話から、各PRに対応する環境を自動で立ち上げるような大がかりなシステムの話まで、お話の幅が広くて興味深かったです。
可用性とコストのリバランス:テレビ砲の過負荷へ対応した話と増強したリソースを適正化した話
(投稿時点ではスライドを見つけられませんでした。確認でき次第更新します)
「テレビ砲(テレビ番組に取り上げられたのを契機とした大量アクセス)」によりサービスが落ちた経験の後、過負荷に耐える環境を如何にコストと可用性のバランスを取りながら作っていったかというお話。「落ちてほしくないがコストも過剰にはかけたくない」「サクサク動いてほしい」といった抽象度の高い要求をまずは具体化することから始めたり、監視に対するケイパビリティが組織にそもそもなかったので勉強会などの施策を行ったり、SREの "How to start" としてお手本のような内容だなと感じました。
インフラコストとセキュリティ課題解決のためのリアーキテクチャリング
一言でこう、となかなか言い表しづらい、かなり濃密なリアーキテクチャリングのお話でした。ドキュメントを、それ単体で意味を成すようなナラティブなスタイルで書いていくお話や、アーキテクチャ変更に伴う組織改編といった、リアーキテクチャリングにまつわるソフト面での変革の話もしっかり入っていたのがよかったです。AWS Fault Injectionは個人的に興味はありつつ利用経験がないのですが、EKS PodにCPU/IO/mem stressをかけられることを今回初めて知り、技術面のお話でも得るものが多くありました。
Improving Incident Response using Incident Key Metrics
インシデントレスポンスの改善にどういった指標を使っていくのかを探求するお話。よく参照される指標にMTTR(平均復旧時間)があるものの、発生からリカバリまでは範囲としては長く、まれな大障害の影響を大きく受けて変動しやすいので、復旧時間をより細分化し、ウィークポイントを明確にしやすい指標が良いのではないかとしています。具体的にどのような名前のどういった指標を用いるのか、各種の文献などに当たりながら検討を進めていく過程が印象的でした。
ガバメントクラウドに向けた開発と変化するSRE組織のあり方
さくらインターネット社のガバメントクラウドに関する取り組みを、SREの視点から解説するお話。半ば趣味のような目的で聴きに行きましたが、並行してSRE室の立ち上げから解体(!)に至るまでの過程のお話もあり、SREの移り変わりという面でも面白いお話でした。SREとしてはかなり挑戦的な取り組みをされていて、強く印象に残りました。
全体を通じて
技術面でのお話も然る事ながら、問題を明確にして、仮説検証しつつ改善のサイクルを回していくような、開発組織のなかでいかに効果的な実践を続けていくかにフォーカスしたお話が多かった印象です。単にSRE bookの内容をそのまま適用するのではなく、各社とも各社なりの工夫や苦労が垣間見える内容でした。SREはその定義において、やること、やれることの幅が非常に広い職種だと思っていますが、可用性、コスト、セキュリティ、その他各種の組織的なケイパビリティにまつわる話があり、一方でやることが増えすぎたときに組織的な責務をどう考えるかといったお話もあり、どれも参考になる1日でした。
SREの実践は会社や組織によって本当にまったく異なってくるので、さまざまなお話に直接触れられる、こういった大規模カンファレンスが増えることは非常に嬉しく思っています。僕はカンファレンス運営側の経験はまったくないのですが、この規模(3トラック)のイベントが初回から大きなトラブルもなく運営されているのは本当にすごいなと感じました。ランチやコーヒーの提供まであり、ありがたかったです。
余談
これは運営やイベントにはまったく関係ない余談ですが、X (Twitter)でのカンファレンス実況つらくなったなぁ……と、思いながら参加していました。昔はTweetDeckを使って、各トラックのハッシュタグをすべて横並びに表示して見ていたのですが、そういうことはもうできなくなってしまいました。目の前の話だけに集中できるので、よい面でもあるとは思うのですが。BlueskyであればTweetDeck likeな https://deck.blue/ があるので、Blueskyもっと流行らないかなぁ、と密かに思っています。
Discussion