😺

SREとして採用されるためには

2025/01/08に公開

はじめに

今回は、オライリーから出版された『SREをはじめよう』を読んで、特に興味深かった箇所を紹介します。この記事では、SREの採用関連について述べますが、これは私個人の見解であり、会社の方針とは関係ありません。本書には、SREを始めるうえで必要なことが多く書かれています。個人だけでなく、組織がSREを始めるための内容も網羅されており、大変面白いものでした。今回はその中のほんの一部分だけを取り上げますので、ぜひ本書を一冊通してお読みいただきたいです。ただし、本書は優れたSREをすぐに始められるようになる本ではなく、多数の参考資料も紹介されているので、各トピックをさらに深掘りしていく必要があります。SREを始める最初の一冊としてはお勧めです。

SREの面接で何を聞くか?

『SREをはじめよう』の採用に関する章において、SREの面接で何を問うべきかについての質問がありました。著者が考えるべき面接での質問は、監視、インシデントレビュー、オンコール対応、SREの存在意義、そしてコードベースへのアクセス権についてです。近々面接を受ける予定がない場合でも、面接官としてこれらの質問を受けたらどう答えるかという視点で考えてみるのも面白いでしょう。

監視システムについて教えてください

監視システムに関する質問は、オブザーバビリティの役割、組織体制、データによる意思決定方法など、多岐にわたる情報を明らかにするのに役立つと著者は主張しています。自分の現在所属する組織での状況を考えてみると、回答に詰まってしまう部分もあるかもしれません。著者は追加の質問として、監視の所有者、使用されている監視システムの種類、このシステムのデータを使った意思決定の方法を挙げています。私の組織でも多数の監視システムが使われており、それぞれのシステムをどのように使って判断しているかの基準も曖昧です。担当者の経験やスキルによる判断・対応が主になってしまっています。

インシデント後のレビューのプロセスについて教えてください

この質問を通じて、組織がどれだけ失敗から学ぼうとしているかを知ることができると著者は述べています。組織内で信頼性がどの程度重要視されているかも知ることができます。追加の質問として、インシデントレビューの目的、障害記録の取り方、レビューに関わる人は誰か、などが考えられます。

オンコールの設定について教えてください

この質問について、著者は他の質問ほど重要ではないと述べていますが、ライフバランスに影響するため確認しておくべき項目としています。組織がどのくらい人道的かを測る指標にもなるでしょう。追加の質問として、オンコールのローテーションの有無、最近オンコールで呼び出されたのはいつか、などが挙げられます。私の組織では、オンコールはベストエフォートでの対応で、ローテーションは組んでいません。休日時にはアラームを発見した人が対応しています。現状、ローテーションを組むことは体制的に難しいため、この形になっています。

SREがどのような問題に対処するために存在していますか?

この質問に対して、明確かつ歯切れの良い回答ができる組織は少ないと著者は述べています。たとえ良い回答が返ってこなくても、その情報自体が面接を受ける人にとっては有益だとしています。私の組織でも、この質問に対する完全な回答は難しく、問題があることは認識しているものの、それが具体的に何であるかはっきりと回答するのは難しい状況です。現状、オブザービリティを活用し、問題の明確化に取り組んでいるところです。

SREは組織の主要なリポジトリにコードをチェックすることができますか?

この質問を通じて、SREがアプリケーションの信頼性にどの程度直接関与できるかを確認できます。私の組織では、SREチームのリポジトリにはアクセスできますが、開発チームのリポジトリにはアクセス権がありません。SREチームはコードを書く役割を担っていないため、このような権限となっています。ただし、インフラコード(IaC)に関しては変更する権限があります。

まとめ

今回は『SREをはじめよう』を読んで、特にSREの採用面接での質問について考えました。これらの質問を通して面接時に有益な情報を得られると思い、取り上げてみました。また、質問を受ける側としても、SREの組織での役割や存在意義を再考する良い機会になるのではないでしょうか。今回取り上げた質問に完璧に答えられなくても、答えられるような組織作りを目指していれば良いのかもしれません。私が所属する組織もまだまだ改善の余地がありますので、より良くしていきたいものです。
※あくまで個人の見解であり、所属組織の方針とは無関係です。

GitHubで編集を提案
GMOメディアテックブログ

Discussion