SRE NEXT 2023 参加記
はじめまして。
NE株式会社でエンジニアをしている いいお(@ss_kosihi)です。
今年度からアプリケーションエンジニアからSREロールにジョブチェンジをしたわたくし。
SREとしてのプラクティスや技術を知りたいと思いSRE NEXT 2023への参加を決意しました。
本記事はその参加記となります。
印象に残ったセッション
勘に頼らず原因を見つけるためのオブザーバビリティ
メトリクス・トレース・ログの3本柱を中心に広くデータを見て原因が潜む範囲を狭めていき全体から細部を特定することで、思い込みによる調査の難航や複合要因の見逃しなどを防ぐというものでした。
NEに入社して3年強、確かに「勘と経験によるデバッグ」をしてしまった時には調査が難航することがあったり、他の原因を見逃していたりすることを思い出し身をつまされる思いです。
実際の取り組まれていたはオブザーバビリティツールを上手く活用していくというものでした。
弊社でももちろんオブザーバビリティツールは導入しているものの、サービスによっては上手く使いこなせていない現状があるので改善活動をしていかなければなと感じさせてくれるセッションでした。
改めて、オブザーバビリティが日々の開発やデバッグを楽にしてくれるかを実感したところです。
1,800万人が利用する『家族アルバム みてね』におけるK8s基盤のアップグレード戦略と継続的改善
弊社ではk8sを利用していないものの「継続的改善」という言葉に興味を惹かれ拝聴しました。
terraformのコードをモジュール化したり、Blue/Greenデプロイを利用するなど手法自体は基本的なものでしたが、セッション中の「日々発生する問題に地道に向き合っていくしかない」という言葉が非常に印象に残っています。
エンジニアとして、既知のソリューションや新規サービスを利用したプラクティスを見ると試してみたい、導入してみたい、と思うものですが、やはり重要なのは継続的に、地道に改善していくこと。
初心を思い出させてくれるようなセッションで非常に有意義なものでした。
SREはロールではなく活動
多種対応なセッションを拝聴したり懇親会で通して他企業の方々と会話したりする中で、SREは特定の人を指すロールの名称ではなく組織をあげて取り組んでいく活動なんだなと考えるようになりました。
弊社では歴史的経緯もあり、SREロールと呼ばれるエンジニアとアプリケーションを担当するエンジニアが組織的に分かれております。入社した当初は恥ずかしながらSREロールの方達がアラートに反応してくれるから……、と受け身なリアクションでしたがこれは個人的には間違っていると思います。
SREロールはアラート対応やオブザーバビリティの改善などを中心に取り組んでいますが、サービスのことをよく知るアプリケーションエンジニアの人たちを巻き込むことでより安定したサービスが提供できる未来があると思います。
将来的にSREロールである我々が先導して上記の活動を組織単位で押し上げられるような立ち位置になれたらなと思わせてくれるとても良いカンファレンスだと感じました。
おわりに
このようなカンファレンスへの参加は初めてだったので当初は少々緊張していたものの、終わってみたら他社との交流や個人的な仕事への取り組みの気持ちの変化など、得られたものはとても多かったなと思います。
今後もSREとして精進していこうという気持ちがさらに強くなりました。
NE株式会社のエンジニアを中心に更新していくPublicationです。 NEでは、「コマースに熱狂を。」をパーパスに掲げ、ECやその周辺領域の事業に取り組んでいます。 Homepage: ne-inc.jp/
Discussion