👾

システム運用アンチパターンを読んでみた

2023/12/14に公開

はじめに

現在チームで「システム運用アンチパターン」の輪読会を開催しています。
今回の輪読会は事前に対象の章を読んできて気になった内容を Miro に付箋でペタペタして感想を言い合っています。

一旦読み終わったので各章について簡単にまとめておきます。

全体的に章の最初に書かれているエピソードは身につまされる内容が多かったです・・・。
後半に具体的な改善策が書かれていて何から取り掛かればいいかわかるので非常にためになりました!

https://www.oreilly.co.jp//books/9784873119847/

各章の簡単な感想

1章 DevOps を構成するもの

1章は DevOps の説明がわかりやすく書かれています。
CAMS の考え方は組織に対して幅広く適用できそうだなと思いました。

DevOpsの柱CAMS
C:culture 文化
A:automation 自動化
M:metrics メトリクス
S:sharing 共有

ツールより人が重要で、エンジニア自身が実行できるアクションを提示してくれる本だということがわかります。

2章 パターナリスト症候群

2章はゲートキーパーとそれを排除するための自動化、承認プロセス自動化の際に発生する問題の解決方法などが書かれています。

まずパターナリズムとは?
「親子関係のように、強い立場にあるものが弱い立場の者に対して介入すること」

パターナリスト症候群とは?
「あるグループが他のグループに対して親のような関係を築いていること」

承認プロセスとか増えがちだと思ったので自動化によって障壁を減らすことの重要さがわかりました。
自動化の継続的な改善も意識していきたいなと思いました。

3章 盲目状態での運用

3章では状態を把握するためのメトリクス、ログの重要性が書かれています。

自分たちの開発したシステムが本番でどのように動いているかを正確に把握するために注目するメトリクスやログについて勉強になりました。

4章 情報ではなくデータ

4章では手元にあるデータをもとに調査を行うのではなく、データにコンテクストや構造を与えることで情報とすることが書かれています。

見せ方や読み手を意識した工夫などが参考になりました。

5章 最後の味付けとしての品質

5章ではテストプロセスとそれが DevOps にどのように適用されるかが書かれています。

テストピラミッドや CI/CD など DevOps でよくある話や、 DevSecOps の話などが自分があまり知らなかった考え方がありました。

6章 アラート疲れ

6章でオンコールについて書かれています。

実際にアラートが多いと大変なのでノイズをなくしてローテーションしながら運用していけたらなと思いました。
また補償についても考えさせられました。

7章 空の道具箱

この章が一番のお気に入りです。

7章は自動化について書かれています。自動化はシステム機能の一部として早い段階から検討したほうがいいことや自動化に必要なスキルセットのギャップを埋める方法などが書かれています。

本当に示唆に飛んだ内容で読みながら線だらけになってしまいました。。。
常に自動化できないか?自動化するに足る内容なのかを意識していきたいと思いました。
継続的に学び続ける工夫を普段の業務に取り入れていく決心がつきました。

8章 業務時間のデプロイ

8種章は業務時間外にデプロイしてるってのはデプロイ戦略に問題があるのでは?という章です。
リリースサイクルが長くなることで起こる問題や多くの修正を一度にデプロイすることで感じる恐怖心など本当にその通りだなと思いました。

具体的な改善策がいろいろ書いてあって今後役に立ちそうだなと思いました。

9章 せっかくのインシデントを無駄にする

9章はインシデントが発生した時にそれをチームの学習の機会とする章です。

インシデント発生時には対応に追われてしまって対応が終わったことで満足しがちですが早めに振り返りのポストモーテムを行い組織の学びに変えていこうとおもいました。

実際に本章を読んだあとにインシデントが発生し、簡易的にポストモーテムを実施しましたがメンタルモデルのズレやその時各人が何を考えて行動を起こしたのかなどがわかり学びに繋がりました。

10章 情報のため込み:ブレントだけがしっている

組織全体で情報の共有がなされていない場合に促進する方法がかかれている章です。

情報がためこまれていることに気づき、どのように共有を促進していくか具体的な学びがありました。
また文化の一部として学習や知識の共有を習慣付ける工夫などが書かれていました。

歴史の長いサービスを運営していたりすると情報のためこみが意図せず行われていたりするので
少しずつでも共有を促していきたいなと思いました。

11章 命じられた文化

11章は文化を構成するものの理解や行動に与える影響や採用などについて書かれています。

現在チームに文化チーフと呼べる人がいるので個人が文化を変えていけることを身をもって体感しています。
自分も良い影響を与えられるようになれたらいいなと思ってこの章を読みました。

また採用についても企業文化への適合性を考慮する大切さが書かれていました。

12章 多すぎる尺度

目標設定と優先順位付けに関する章です。

今まさにやることが大量にあって優先順位付けに日々悩んでいるので気になる章でした。
全方位にタスクが溜まっているのでアイゼンハワーマトリックスなどを活用していきたいと思いました。

まとめ

全体を通して示唆に富む内容でした。
アンチパターンだけでなくその解消方法や考え方など1エンジニアとして取り組んでいける内容が豊富に書かれています。
オンプレやそれに近い状態で長期間サービスを運用を行っている組織は絶対に読んだ方がいいと思います。
かなりお勧めです!

https://www.oreilly.co.jp//books/9784873119847/

レスキューナウテックブログ

Discussion