BindPlane を使ってオブザーバビリティパイプラインをリモート管理し、Cloud Trace にトレースを送ってみる
はじめに
こんにちは。Google Cloud Champion Innovator 逆井です。この記事は Champion Innvotor アドベントカレンダーの 21 日目の記事になります。納品が少し遅れてしまいました。
AI ネタが盛り上がっていますが、オブザーバビリティが好きなので、今回は(も)オブザーバビリティのネタを書きます。本記事では、BindPlaneを使って Google Cloud にテレメトリーシグナルを送信するパイプラインをリモート管理するする方法をハンズオン的に紹介しようと思います 👋
まず BindPlane とはを簡単に
BindPlane は observIQ が開発している、オブザーバビリティパイプラインやテレメトリエージェントを大規模に管理するためのプロダクトです。BindPlane OP というエージェント群を管理するための UI を持つコントロールプレーンと、BindPlane Agent から構成されます。BindPlane Agent は OpenTelemetry Collector の BindPlane ディストリビューションです。
BindPlane Agent でテレメトリーシグナルの受信、処理、送信を行い、その BindPlane Agent を BindPlane OP から制御、管理します。送信先(Destinations)も多くをサポートしており、このあと書く Google Cloud もサポートされています。わたしが所属している Datadog もサポート範囲内です。テレメトリー受信元(Sources)のラインナップも豊富で、今回は OpenTelemetry を使っていきます。下記のアーキテクチャはドキュメント引用しています。
ここでは深く触れませんが、BindPlane OP は SaaS とオンプレミスを選択できたり、いくつかのエディションが存在しています。詳しくは BindPlane のソリューションページを参照してください。
落穂拾い...🍂
BindPlane OP が BindPlane Agent(OTel Collector)を管理する仕組みは Open Agent Management Protocol(OpAMP)です。OpAMP は大規模エージェント群をリモート管理するためのネットワークプロトコルで OpenTelemetry で管理されています。ソース)。
BindPlane OP が OpAMP サーバーであり、BindPlane Agent で OpAMP クライアントが起動しています。BindPlane Agent 自体は GitHub で公開されています。OpAMP については今年の Cloud Native Days で取り上げて話たので気になるかたは見てみてください。このセッションで出てくる OpAMP バックエンド(サンプル)のめちゃくちゃリッチ版が BindPlane OP です。
セットアップ
実際に動かしてみましょう。ワイワイ。以下のような構成です。
GKE 上にトレース計装したアプリと、BindPlane OP / Agent をデプロイします。BindPlane OP の UI からオブザーバビリティパイプラインをリモート操作して、トレース情報に適当なタグ(Advent:Calendar...!!
)を付与してみます。簡単にセットアップ手順も見て行きます。
BindPlane OP デプロイ
Helm が用意されており、手順に従って簡単にデプロイができます。Single Instance
、High Availability
モードがあり、今回はデモなので Single Instance
モードでセットアップします。
BindPlane のライセンスが必要なので Free で作成をしました。また、割と大きめのリソースリクエストが設定されているのでデプロイ時はご留意ください。
resources:
# Request 2 cores and allow cpu bursting.
# Request fixed amount of memory, 8Gb.
requests:
cpu: '2000m'
memory: '8192Mi'
limits:
memory: '8192Mi'
正常にデプロイできていれば、以下のように Pod を確認できます。
NAME READY STATUS RESTARTS AGE
bindplane-0 1/1 Running 0 3m42s
bindplane-prometheus-0 1/1 Running 0 3m42s
bindplane-transform-agent-f5c6fb575-5cgtr 1/1 Running 0 3m42s
BindPlane Agent のデプロイ
次に BindPlane ディストリビューション OTel Collector である、BindPlane Agent をデプロイしていきます。これは BindPlane OP の UI から行っていきます。UI は 3001 ポートで開いています。全て書くと細かいのでほどよい粒度で書いています。
Configurations の作成
まずは「Configurations > New」から BindPlane の Configuration を作成します。今回は Kubernetes に Gateway
としてデプロイする Configutations を作成します。他にも Cluster や Node があります。
テレメトリーの受信(Source)を設定します。今回は OTLP にしました。
テレメトリーの送信(Destinations)を設定します。もちろん Google Cloud です!
作成がうまくいくと、以下のような OTLP -> Google Cloud のオブザーバビリティパイプラインの設定が UI で見えます。かっこいい。
作った Configurations を使って Agent を作成
次に、ここで作った Configuration を使って Agent を「Agents > Install Agents」から作成していきます。
Configuration が作成されるので Kubernetes にデプロイしていきます。デプロイが成功すると BindPlane OP の UI 上で Agent が検知され可視化されます(OpAMP のコネクションが確立されます)。
トレースを OTLP で吐き出し続けるアプリケーションもデプロイ済みなので、先ほどのオブザーバビリティパイプラインで「TRACES」を選択してあげると、トレース情報がパイプラインを流れていることが確認できます。いい感じです。
BindPlan Agent をリモート設定し、トレース情報を処理してみる
画像が多くて疲れてきたと思いますが、最後 BindPlane OP の真骨頂であるリモート設定を行って終わろうと思います。
パイプラインのプロセッサーを押下します。
今回は簡単のために「Add Fields」プロセッサーを追加して、謎のタグとして「Advent:Calendar...!!
」を付与する設定を追加します。ちなみに、他にもたくさんのプロセッサーたちが用意されています。見てるだけで楽しくなります。
追加できるとオブザーバビリティパイプライン上のプロセッサーの個数が可視化されます。
実際に Cloud Trace に送られたトレース情報を見てみましょう。ちゃんと意図したタグが付与されていることがわかりました 🥂🥂🥂
まとめ
今回は BindPlane を使った OTel Collector(BindPlane Agent)のリモート制御を行い、Google Cloud Observability におけるオブザーバビリティパイプラインの効率的な管理についてご紹介しました。もちろん Google Cloud 以外でも活用は可能です。
OTel Collector をはじめとするテレメトリーエージェントは、監視対象が大規模になるほど管理コストが膨大になっていきます。このようなリモート管理のプロダクトを用いることで恩恵を受けることができます。またこのような技術は OpenTelemetry の OpAMP という標準プロトコルが下支えをし実現されていることを最後触れて結びとさせていただきます。
それではみなさん、良いお年を🎍
Discussion