🦎

「サイトリライアビリティワークブック」書評

2020/11/23に公開

オライリージャパン出版の
「サイトリライアビリティワークブック SREの実践方法」を読んだので個人的な備忘録です。

■どんな本か■
Google社内で共有されていたサービス運用の知見が紹介されています。

■参考になった章■
12章「非抽象的な大規模システム設計の紹介」の
AdWordsの例です。
Googleのweb検索で表示される文字広告をユーザーがクリックして広告が表示された回数のレポートを集計するシステムを順を追って設計していきます。
どういう思考プロセスを経て設計するのかが書かれているため、
他のシステム設計の参考になると思います。
また、SLOの指標などを設定して、
具体的にどのような要件を満たせばいいのかを数字を使って説明されています。

■認知の過負荷■
実際に作業量はそこまで多くないのに、異常に作業量が多いと感じることがたまにあります。
Googleでは、この現象を「認知の過負荷」と呼び、
その原因はリーダーとの対話不足にあると説明しています。
認知の過負荷は虚構ではなく、
実際にメンバーが負担に感じている時点で「実際の過負荷」として扱うべきである
とGoogleは警告しています。

■再認識した理論■
Kurt Lewinの「解凍-変化-再凍結」モデルです。
https://journals.sagepub.com/doi/pdf/10.1177/0018726715577707

集団内の力学に変化をもたらす3ステップを紹介しています。
1.集団に変更が必要であることを納得させる
2.変更の実施
3.新しいパターンを制度化する

チームのみならず、新システムの導入時に現場に浸透させる際のテクニックの基本ですね。

<まとめ>
全体が使えるハウツーという印象はありません。
というのも、AWSの設計原則でも似たようなことを言っているという意味で
目新しさがなかっただけで、これが当たり前になりつつあるのだと思います。

Discussion