SRE と名乗って 1 年くらい経つのでやったことを振り返る
SRE Advent Calendar 2024 12/2(月) 分の記事です。
あいさか です。
今年 iCARE に入って1年弱経ちました。SRE と言うロールになっても同じ期間が経ちます。
1年、SRE として何やったかな〜と言うのを振り返ってみました。
やったこと
開発の皆様と課題解決
CI やちょっとインフラぽいようなところはヘルプに入って、次やるときは開発者が自分でできそうな資料を錬成したり補助ツールを用意したりメトリクスの見方を教えてたりするお仕事をしています。CS からいただいたお客様からのお問い合わせに対して開発者と連携して SRE 的な視点で調査したり、回答を提示したりということをしています。
Terraform を書いたり直したり
Terraform たのしいね。開発者が使える環境をポコポコ生み出しています。
障害対応
CI に謎に破壊的変更が入って落ちるとか、外部サービスの障害でデプロイにちょっと支障があるとか、サービスそのものには影響ないけどなんか困る、みたいな細かい障害を含めて対応にあたっています。
ポストモーテムを運用
週一の「インシデントマネジメント委員会」で、その週のインシデントのポストモーテム起票を呼びかけたりタスクの確認をしたりしています。個人としては「そもそもポストモーテムってなんぞや」の部分を開発チームにお知らせしたり、「インシデントマネジメント委員会」の取り組みそのものの振り返り・振り返りで出てきたタスクの進行などをつとめました。
AWS CLI をゴリゴリ書く
昨日停止メンテナンスを実施しました。当日手順用にたくさん CLI をかけたので満足です。それ以外にも開発者に使ってもらえそうな CLI をゴリゴリ書いています。
PagerDuty から電話を受ける
とりあえず 4 (acknowladge) 押して対応するの覚えました。
ミドルウェアのバージョンアップと調査
直近では Ruby バージョンアップのために諸々調査してました。最近ずっとドキュメント書いてた記憶しかない。社内ツールで使っていた Beanstalk の乗り換えとかもやりましたな。
Datadog / Sentry / Sendgrid とにらめっこ
Datadog はいいぞ(いいぞ)。Sendgrid の CLI って便利ですね。
セキュリティ関連の対応や調査
CVE-ホニャララに立ち向かうぞ。
セキュリティチェックシート
BtoB SaaS な皆々様はきっと全人類触っているセキュリティチェックシートなるものを嗜んでみんとす。各社様のセキュリティラインに達しているかどうかを判定していただく大事なお仕事です。情シスや上司の力で回答する材料を揃えていただいてありがたいです。
RubyKaigi
5 年ぶりに RubyKaigi に行ってきた!レポート一生下書きに眠ったままなので えいやで公開 します。
ドメインの要である産業保健について学ぶ
メンタルヘルス・マネジメント検定はいい勉強になりました。試験の結果が今週末に出てくるのでこわい。自己採点では若干足りない。
そのほか
エクセルをなんとかするお仕事
QA のお手伝いと見せかけてこちらが介護していただく
成り行きで会社のアドベントカレンダーの主催
みんなで ISUCON 出てみようぜ!って言うだけ言う係
新入社員のメンター
オフィス移転対応(主にIPアドレス周り)
SRE やってみてどうよ
たのしい!
みんなでやろう SRE。
Discussion