Open2

【読書メモ】オブザーバビリティ・エンジニアリング

mossan_hoshimossan_hoshi

https://learning.oreilly.com/library/view/observability-engineering/9781492076438/

原題 Observability Engineering
訳題 オブザーバビリティ・エンジニアリング
リリース年月 2022/5
カテゴリ 監視・可観測性
おすすめ度(5段階) ⭐⭐⭐⭐☆
要点 ● マイクロサービス等、近年の複雑なシステムではメトリクスベースのログによる監視は限界を迎えつつある
● メトリクスは既知のエラーにしか対応できないが、マイクロサービスでは未知のエラーが発生する
● 構造化イベントにより可観測性を高め、探索的な問題解析に対応する必要がある
● 問題を適切に切り分けるためにも高カーディナリティ性が必要

※今回読んだのはオライリーのサブスクで提供されている原著です。訳本と内容が異なっているかもしれません

mossan_hoshimossan_hoshi

パートⅠ 可観測性への道

第1章 可観測性とは何ですか?

まずはじめに、「可観測性」と「監視」は別物です。

「監視」は既知の問題に対処します。
メトリックを設定して特定の問題が発生したときに検知します。

「可観測性」は未知の問題に対処します。
カーディナリティが高く高次元の構造化されたテレメトリデータにより、探索的に問題の発生地点にたどり着くことができます。

ではどちらが良いのでしょうか?

クラウドベンダー/コンテナ/オーケストレーションツール/プロビジョニングツール等の進化のおかげで複雑なクラウドシステムをデプロイする閾値はこれまでになく下がっています。

一方で運用・保守の難易度はシステムの複雑さに応じて上がってきています。
複雑になればなるほどこれまでにないタイプのエラーが発生します。
そのようなバグのデバッグで最も難しいのは、コードがどのように実行されるかを理解することではなく、システム内のどこに問題のあるコードが存在するかを見つけることなのです。

というわけで初めて出会うエラーに対処できる可観測性の重要性が高まってきているのです。

可観測性には3つの柱があります。
「高カーディナリティ」「高次元性」「探索可能性」 です

可観測性の3大要素①「カーディナリティ」

カーディナリティとは、データセットに含まれるデータ値の一意性です。
言い換えるとデータベースの同一列内におけるデータの重複度合いです。

カーディナリティが高いということはデータが重複していないという事です。
高カーディナリティの代表はIDです。すべての項目が異なるため最もカーディナリティが高くなります。

カーディナリティが高いことによるメリットはデバッグ製のしやすさです。
たくさんのデータの中から特定のデータをピンポイントに抽出することができます。

可観測性システムにおいてはカーディナリティが非常に重要になります

メトリックの場合は、既知の問題に対してメトリックを設計する必要があり、
対応する問題が増えれば増えるほどコストがかさみます。

可観測性の3大要素②「次元」

可観測性においては高いカーディナリティつまりキーに相当するものの数を次元として定義します。
次元が高ければ高いほど詳細な絞り込みが行えるので、非常に好ましいです。
現代の複雑なシステムにおいては高い次元が必要になります。

可観測性の3大要素③「探索可能性」

可観測性が高いシステムは高カーディナリティのデータと高次元のテレメトリーデータにより探索的にシステムを解析することができます
このような探索を行えることを探索可能性と呼びます。

第2章 デバッグの実践が可観測性と監視の間でどのように異なるか

第3章 可観測性のないスケーリングからの教訓

第4章 可観測性とDevOps、SRE、およびCloudNativeとの関係

パートII。可観測性の基礎

第5章 構造化イベントは可観測性の構成要素です

第6章 イベントをトレースにステッチする

第7章 OpenTelemetryを使用したインスツルメンテーション

第8章 可観測性を達成するためのイベントの分析

第9章 可観測性と監視がどのように連携するか

パートIII。チームの可観測性

第10章 チームでの可観測性プラクティスの適用

第11章 可観測性主導の開発

第12章 信頼性のためのサービスレベル目標の使用

第13章 SLOベースのアラートの処理とデバッグ

第14章 可観測性とソフトウェアサプライチェーン

パートIV。大規模な可観測性

第15章 ビルドと購入および投資収益率

第16章 効率的なデータストレージ

第17章 十分に安くて正確:サンプリング

第18章 パイプラインを使用したテレメトリ管理

パートV.可観測性文化の普及

第19章 可観測性のビジネスケース

第20章 可観測性の利害関係者と同盟国

第21章 可観測性成熟度モデル

第22章 ここからどこへ行くか