🤽♂️
ポストモーテムとは?
はじめに
大変恥ずかしながら、最近参加したエンジニアイベントにて、
初めて「ポストモーテム」という言葉と出会いました。
自分なりにポストモーテムについてまとめてみました。
ポストモーテムとは
ポストモーテムとはシステムやサービスで発生した不具合やインシデントの振り返りを行う事後検証のことです。
失敗を振り返り、同じ過ちを繰り返さないためにどうすれば良いのか、事実の把握と根本原因キュ名、再発防止のための案を出す会のこと。
これだけ聞くと、ポストモーテムを知らなくともやっている人は多そうですね。(自分も無意識にやっていました)
他社事例紹介
某食領域IT企業のやり方を紹介します。(イベントで紹介されていたものです)
開催ルール
ポストモーテム会を以下のルールに基づいて開催する。
- ポストモーテムを週1回設定
- 重大な不具合・インシデントが発生した場合は、早急に関係者を集めてポストモーテム会を実施
事実のタイムライン・出来事の影響・応急対応策・事象の原因・再発防止・根本原因の調査などなど、次へのアクションを話す。
実施の判断
必須
- ユーザへのお知らせが必要となるような不具合
- サービスが5分以上停止した場合
- その他ビジネスに重大な影響を及ぼした場合
推奨
- 重要機能が動作しない
- CS問い合わせが発生したものや、長期で発生していたもの
- 再発の恐れがあるものや原因特定に時間のかかったもの
任意
- 利用者への影響がほぼない場合(誤字脱字など)
リスクレベルみたいな感じで分けているようですね。。
実施における注意
- 個人の非難や責任追及を行わない
- 対応策に絶対「意識の改善」を用いない
- すぐにアイデアを出す必要は全くない
批判はせず、原因究明と再発防止にだけ焦点をあてて、システムやプロセスの改善をするための話し合いを行うこと
ポストモーテムのメリット
- ドキュメント(議事録)に残すことで、学びがチーム(組織)に共有されること
- 振り返り文化が根付き、メンバー間での品質の向上・維持の意識が高まること
- 自分の知らない領域での事象をキャッチアップできること
- 実際に開発する際に過去事例から学んで自己を防げること
などなど
おわりに
さーーとまとめてみましたが、ポストモーテム自体は目新しいことではありませんが、
ポストモーテムの注意点などをメンバー間で浸透させておくことが重要かなと思いました。(でないと、ただの責任追及の裁判になってしまう笑)
今している定例や会議をポストモーテムと呼びなおすだけでも、全然効果がありそうだなとかんじました。
Discussion