事業部をまたいだ全社SRE共有会をはじめて気づけば3年経っていた
MIXI DEVELOPERS Advent Calendar 2025(シリーズ 1) 16日目の記事です
多くのエンジニアの皆さまは、意識する/しないに関わらずSREを実践していることが多いと思います。
また、SRE関連のカンファレンスやミートアップの盛況ぶりを見てもわかるように、それぞれの企業や組織、プロダクトにおけるSREに関する知見共有や意見交換に価値があるといえるでしょう。
もちろんこれは同じ企業で複数事業を展開する場合でも同様です。
弊社・株式会社MIXI(以下、MIXI)では、2022年12月から各事業部の(ロール名はさまざまですが)SREが月に1回集まって知見を共有する会を続けており、気づけば3年が経過したところです(以下、「共有会」と呼びます)。
今回は、その取り組みをはじめたきっかけや、3年間ゆるく続けてきた社内SRE共有会でやってよかったこと、長く続けるコツを振り返って(一部主観的に)書いていきます。
きっかけ
この取り組みをはじめたきっかけは、各事業部にSREやSRE的な活動をしているエンジニアがたくさんいるのに、事業部を横断するような(定期的な)交流や知見共有の場がほとんどないのはもったいないと感じたことです。
冒頭にも書いたように、事業やその特性が異なっていても参考にできる知見や共通課題は多いはずです。
また(SREに限らず)専門領域のあるエンジニアは(心理的に)孤独になりがちなので、同じ役割を担う仲間が社内にいることを実感できる場があると、モチベーション向上や困ったときの相談先としてもよいのではないかと考えました。
どんな感じでやってるか
運営で大切にしているのは、知見共有はもちろんですが、それと同じくらい「ゆるさ」も重視しています。
毎回決まった議題や準備したテーマで議論するというよりも、ランチを食べたり休憩したりしながらざっくばらんにわいわい情報交換をする雰囲気を大切にしています。
おおまかな流れや話題の例としては
- SRE関連のトピック
- インシデント対応、ポストモーテム共有、運用改善、コスト最適化など
- SRExAI関連のトピック
- SRE業務におけるAI活用、生成AIツールの紹介やPoC共有など
- イベントや登壇共有
- 社内勉強会開催や外部カンファレンス登壇など
という感じで、毎回30分〜1時間程度行っています。
ある程度の流れはありつつも、ふわっとした相談、TIPS、やってよかったことなど、なんでもありの雰囲気です。
よく話題になること
インシデント対応の話
共有会での定番のトピックは、やはりインシデント対応の話です。
ポストモーテムそのものの説明は割愛しますが、インシデントを振り返り検知や対応の改善点を洗い出し、それを次回以降に活かすことが目的です。
共有会で話題にする意味としては、他の事業部の事例を踏まえてあらかじめ「こういうインシデントが起きたときにどう対応するか」を議論しておくことで、いざというときの対応がスムーズになる効果があります。
また、インシデントどう対応したかを共有することで、他ののチームから「こういう対応もあるのではないか」といったフィードバックを得るなど第三者の視点を取り入れられるのもメリットです。
AI活用の話
昨今のAI活用の波もあり、2025年からは「SRE業務の文脈でどう活用できるか」というトピックを明確に設けています。
具体的には、以下のようなテーマが話題になりました。
- SRE業務の支援
- コードレビュー
- アラートの一次対応
- インフラコスト分析
- システムログの監査
- ポストモーテム作成
- クラウドベンダーやオブザーバビリティツールが発表するAI機能の紹介やPoC共有
- これからやりたいことの共有とディスカッション
(SRE文脈に限らず)生成AI活用はツールは同じでも使い方や効果が千差万別なので、各チームが試行錯誤している段階で情報交換するのは非常に有益です。
運用課題・改善の話
トピックとしてはシステム運用に関する課題や改善事例の共有も鉄板です。
たとえば、以下のようなものがあります。
- アプリケーションやデータベースのパフォーマンスチューニング
- インフラコスト最適化
- 言語やライブラリ、ミドルウェアのアップデート
- オブザーバビリティ改善
MIXIでは、ユーザー数が多いサービスを複数運営しているため、負荷特性やトラフィックのパターンは異なるものの話題になることが多いです。
組織・文化の話
技術的な話題だけでなく、組織や文化に関する話題も出ます。
- 新メンバーがJOINしたときの紹介
- 外部の勉強会やカンファレンスへの登壇報告
- 他社との合同勉強会の開催報告
- SREチーム内での勉強会やワークショップの実施
特に、外部イベントへの登壇や他社との交流は、SREコミュニティ全体への貢献にもなりますし、社内のモチベーション向上にもつながります。
やってよかったこと
ある程度「ぶっちゃけた話」ができる
共有会を通じて、各事業部のSRE同士がある程度「ぶっちゃけた話」ができる関係性が築けたのは大きな成果だと感じています。
どういうことかというと、たとえばインシデント対応の詳細や失敗談、具体的なリクエスト数やコスト削減額など、組織外には話すことができないことは当然ながらあります。
しかし、事業部が異なるとはいえ同じ会社内のエンジニア同士であれば、ある程度踏み込んだ話がでできます。
(もちろん社内とはいえ他の事業部に話せないこともあるため、その線引きはあります)
それによって、より実践的で具体的な知見共有が可能になっています。
事業が違っても参考になることは多い
MIXIではスポーツ、ライフスタイル、デジタルエンターテインメントなど事業のドメインは全く異なりますが、クラウドインフラやデータベース、言語といった基盤技術は共通する場合があります。
そのため、あるチームの改善事例が他のチームでは形を変えて応用できることもあります。
また、負荷特性などはサービスによって異なり、その背景や対策も異なります。単に技術的な知見だけでなく、事業やサービスの特性に基づいた運用ノウハウを知ることができるのも価値があります。
予想外の学びがある
予想外の学びが得られるのも共有会の魅力です。
例えば、コスト最適化の話題から「そういえばRDSのスナップショットにめちゃくちゃお金がかかっていた」という発見があり、他のチームも「自分たちも確認しなきゃ」となる、といった具合です。
あるいは、AIツールの話題から「そういえばこのツール使える」「このMCPサーバーがおすすめ」という情報交換が始まり、各自が持ち帰って試してみる、という流れも生まれています。
小さなネタでも共有できる雰囲気がある
共有会を振り返ると、「これってみんなに話しておもしろいのかな〜」と躊躇していた話題が、実は「意外と面白い!」と評価されることが多々ありました。自分にとっては当たり前のことでも、他のチームにとっては新鮮な発見だったり、逆に自分が些細だと思っていた工夫が、他のチームの課題解決のヒントになったりします。
小さなネタでも気軽に共有できる雰囲気があると、話のきっかけが増えていいですね。
共有会では毎回議事録ページを作成して事前にトピックを募集しているのですが、必ずしも十分な議題が集まらないこともあります。
しかし、その場合でも「最近こんなことあったよ」「これ困ってるんだけど誰か知らない?」といった気軽なコミュニケーションで十分に盛り上がります。
結果的にチーム間の知見共有や相互支援につながっています。
(もちろん、あまり盛り上がらずに淡々と終わる回もありますが、それはそれでよしとしています)
横のつながりができる
月に1回顔を合わせることで、各事業部のSRE同士のつながりができたのも大きな成果です。
共有会以外でも「そういえばあの人に聞いてみよう」「あのチームがやってたやつ参考にしよう」という相談がしやすくなり、会社全体としてのSRE力が底上げされていると感じます。
Slackチャンネルでの日常的な交流が活発になった
共有会の開始と同時期に、全社SREを中心として誰でも入っていいSlackチャンネルを作成しました。
このチャンネルは、想定以上に活発なコミュニケーションの場になっています。
SREに関連するブログ記事や技術トピックの共有はもちろん、クラウドベンダーやGitHubなどの障害情報をいち早く共有するのにも役立っています。
「あれ、これってうちだけ?」と思ったときに気軽に聞ける場所があるのは心強いです。
月1回の共有会も価値がありますが、Slackでの日常的な会話や知見共有が増えたことが非常によかったと感じています。
共有会とSlackチャンネルが相互に補完し合って、より活発なSREコミュニティが形成されています。
ゆるく長く続けるコツ
完璧を求めない
毎回完璧な議題を用意する必要はありません。
ランチを食べながら「最近こんなことあったよ」「これ困ってるんだけど誰か知らない?」といった気軽なコミュニケーションでも、結果的にチーム間の知見共有や相互支援につながります。
もちろん、より深い議論や準備ができるに越したことはありませんが、完璧を求めすぎると続けるのが難しくなります。
気軽に参加できる時間帯を選ぶ
ランチタイムなど、気軽に参加できる時間帯を選ぶのがポイントです。
業務時間をあまり圧迫せずに参加できる雰囲気があると続けやすいです。
小さなネタも歓迎する
特に大きな改善につながったりしていなくても「特に役に立つような情報はないけど褒めてほしい」といった軽いノリの共有もウェルカムにしています。
また成功事例だけでなく失敗談も歓迎する雰囲気が大事です。
定期開催で習慣化する
月1回など定期開催して習慣化することで、「次の共有会で話そう」というストックができます。
不定期だとつい忘れてしまうので、定期開催がおすすめです。
共有会における課題も共有する
3年続けてきて、いくつかの課題も見えてきました。
-
ネタ切れ感
- 毎月コンスタントに共有したいトピックがあるわけではないので、特定のテーマを深掘りする回を設けたり、外部ゲストを招いたりするのもありかもしれません。
-
話しやすい場づくり
- 「どこまでPJの話をしていいかわからない」という声もあるので、事前にアンケートを取ったり、テーマを決めてディスカッション形式にしたりする工夫もありそうです。
-
情報の機密性
- 議事録の共有範囲や、どこまで記録に残すかのガイドラインを整備することで、より安心して話せる場になるかもしれません。
こういった課題も含めて、共有会で話し合いながら改善していくのがいいのかなと思っています。
まとめ
ここまで、MIXIにおける全社SRE共有会の取り組みについて紹介しました。
SREに限らず、同じ役割を担うエンジニア同士が交流し知見を共有する場は、組織全体の技術力向上やモチベーション維持に寄与するというのは間違いないと(個人的に)思います。
N=1の取り組みではありますが、まずは「ゆるく長く続ける」ことを重視してはじめてみるのはいかがでしょうか。
Discussion