🧑🏻‍🏫

「PagerDuty Summit Japan 2023」へ登壇しました!

2023/08/08に公開

こんにちは!
株式会社ココナラのシステムプラットフォーム部でプロダクトインフラと社内情報システムを担当している ゆーた と申します。

15回目のブログ投稿になりますが、2回連続でイベント登壇レポートです。
7/26(水)に「PagerDuty Summit Japan 2023」へ登壇しました!

https://www.event-info.com/pagerdutysummitjapan-2023/

発表者

会場は東京ミッドタウン日比谷「BASE Q」という場所でした。
リクルートに所属していた頃に近くで勤務していたことはあったのですが、東京ミッドタウン日比谷ができてから、有楽町に行ったのは初めてです。

いくつか写真で振り返ります。
まずは、控室の写真です。登壇直前までゆったり過ごすことができました!

控室

イベント参加者は首から名札を下げるのですが、私はスピーカーの名札を下げていたので、参加者の「おぉ〜!登壇者か!」という視線を感じながら、ブースを回っていました笑

名札

ホール入り口にはイベントのディスプレイがされており、企業のブースもありました。

ホール

今回、事前にモデレーター・スピーカーで雑談していたので、パネルディスカッション開始前に打ち解けることができました。
今までのパネルディスカッションで一番和気あいあいとして取り組めました!

まずはパネルディスカッション直前の写真です!モデレーターとスピーカー4名で!

スピーカー1

ここからはパネルディスカッション中の写真です。
コミュニティイベントということもあり、お酒も解禁されていたので、登壇側も一緒にお酒をいただきながら、フランクにお話しました!

スピーカー2

スピーカー3

スピーカー4

スピーカー5

スピーカー6

パネルディスカッション終了直前にPagerDutyのキャラクターであるPagey君も来てくれました。
会場の一部が写っていますが、こう見るとたくさん聴講してくれた方がいたので、嬉しかったです!

Pagey君

パネルディスカッション終了後はAsk The Speakerにも立たせていただきました!
久しぶりに名刺が無くなりそうになりました…たくさん持っていて良かった…

Ask The Speaker1

Ask The Speaker2

いつもながらにノベルティもいただきました。ありがとうございます!
ブースでノベルティのおかわりまでいただき、本当にありがとうございました!!

ノベルティ1

ノベルティ2

イベント概要

「ビジネスを止めないインシデント対応 ~AIの力で実現するオペレーショナル・レジリエンス〜」と題して、インシデント対応や未然に防ぐ仕組みのベストプラクティスについて、議論するイベントでした。

その中のコミュニティイベントに登壇しています。詳細は以下の通りです。

システム運用やオンコール担当者など、実際に運用を担当するエンジニアのための情報交換の場です。
完全クローズドのイベントとなり、その場にいないと聞けない、オフレコセッションを提供します。

登壇告知ブログにも記載していますので、以下もご参照ください。

https://zenn.dev/coconala/articles/c5bc68e427f177

登壇内容

SREみたいなことやってるけど、質問ある? ぶっちゃけトーク というお題のパネルディスカッションに登壇しました。
具体的には、以下の内容をお話しました。

  • 自社において、インシデント対応の体制をどのように築いたか
  • 辛かったオンコール対応事例
  • オンコールの負荷を下げるための工夫
  • PagerDutyの面白い使い方や押しの機能

トピックスだけ、かいつまんでご紹介します。

私が入社する前にココナラではPagerDutyを採用していました。
たまたま、リクルートに所属していた頃にPagerDutyを導入していたため、そこの知見を入社後にココナラへフィードバックしていきました。

ココナラではエンジニア全体でオンコールシフトを持ち回りしており、私が入社した当時は20名程度でシフトを回していましたが、現在は40名以上がシフトに入っているので、徐々により関係性の強い部署に絞り始めています。

アラートにも様々な種類があり、自社起因のものもあれば、クラウド環境起因のものもあります。
もし、後者が発生した場合は復旧を祈りつつ、その後の対応は今後の対策検討を進めています。

アラートが発生した場合にココナラではそのキーワードに応じたRunbookや対応予定Issueが通知される仕組みを採用しており、オンコール担当者が切り分け・対処しやすいような仕組みを実現しています。

今後、Event Analyticsを利活用して、例えば以下のような分析・打ち手の創出を行いたいと考えています。

  • リリースタイミングとアラート数を突き合わせて、プロジェクトのQA工程や前工程へフィードバックする
  • 人単位に集計を行い、オンコールの負荷の偏りやコンディション把握に活用する

ココナラの事例は記事として公開されていますので、ぜひご覧ください!

https://www.pagerduty.co.jp/topics/494/

登壇してみてどうだったか?

偶然ですが、2週連続でユーザー企業とのパネルディスカッションに登壇させてもらったので、前回よりは簡潔に話せたように思えます。

冒頭に写真を載せた通り、楽しく話せる雰囲気作りができており、 事前にモデレーター・スピーカーと雑談を交えて話せていたので、本当に楽しく取り組めました!

また、他社で苦労していること・工夫していることを現場の生の声で聞けたので、さっそくココナラでも検討してみようと思います。
完全オフレコなので詳細は書けないのですが、「心理的安全性担保」に各社かなり気を使っていることがわかりました。
オンコール対応が発生しないに越したことはないので、「不要なアラートの削減」「自動リカバリー」 など、まだまだ検討する余地はあると思いますので、1つ1つ紐解いて取り組んでいきます。

最後に

今後も横とのつながりを積極的に増やしていけるようにイベント登壇を頑張ろうと思います!
このような機会を与えてくださったPagerDuty社の運営・スタッフの皆様、ご一緒してくださったモデレーター・スピーカーの皆様、本当にありがとうございました。改めてお礼を申し上げます。


ココナラでは、一緒に事業のグロースを推進していただける様々な領域のエンジニアを募集しています。
情報システム領域だけでなく、フロントエンド領域・バックエンド領域などでも積極的にエンジニア採用を行っています。
少しでも興味を持たれた方がいましたら、エンジニア採用ページをご覧ください。

https://coconala.co.jp/recruit/engineer/

Discussion