OpenTelemetry Meetup 2023-10 に登壇し、計装事例について話しました #oteljp
はじめに
こんにちは 👋 逆井(さかさい)です。
2023年10月19日に開催された OpenTelemetry Meetup 2023-10 にて、Otel 活用の事例紹介として登壇をさせていただきました。その際の感想をつらつらと書いていきます。
※ はてブロや note などのメディアがないのと Zenn が好きなのでこちらにダンプしようと思います。 投稿カテゴリー Idea
でいいかな、、、まぁいいか。
まず初めに、イベントを企画・運営してくださった方々や CARTA HOLDINGS 社や、飲み物を提供してくださった Splunk 社には大変感謝です。終始カジュアルでとても良い雰囲気でした!
以下の写真は開始ちょっと前の会場の様子です。Connpass の会場参加は上限の 60 人、オンライン参加申し込みも 420 人(同時接続数はどんなもんだったんだろ?)と Otel やっていき機運
を感じます。こんなに聴講者がいるオフライン登壇は Master の公聴会ぶりだったので緊張しました。
ジョインしたチームのマイクロサービスたちを再計装した話
発表したスライドと、当日の動画は以下です。
今回は事例にフォーカスして、Otel 分散トレースの取り組みをお話しさせていただきました。
アプリにトレース計装を施すことはそんな大変じゃないです。しかし、チーム特性上、長期的な運用を見据え、メンバー全体がテレメトリー計装から計測、性能改善までできる体質形成を行なっていくことも大切というコンテキストでお話ししたつもりです。
課題として、計装が不十分だったため、特定のサービスで分散トレースが途切れてしまっている点を挙げました。一部の計装は実施していたが、うまく浸透していなかったパターンです。SNS などの反応を見るとあるあるみたいで、なるほど。となりました。
今回は解決策の一つとしてトレース計装のガイドラインを作った事例についてご紹介しました。こういったドキュメントによる手順化は積み重なることで地味に時間食うので、開発スピードとトレードオフと捉えられちゃいがちです。ただ、今回の再計装などの課題も踏まえて、ちゃんと開発規約として取り扱うことにしました。「大切かもしれない。」と共感の声も挙がっていた気がします。あとは「こう言うルールの整備は大手の文化特性もあるかもね。」という発言もあり、確かにそれもあるかもなぁとなりました。
セッションでは時間の都合上触れませんでしたが、過去の計装をそのまま使えたわけじゃなかったと言うことをフォローアップコメントとして残します。古いバージョンの OpenteTemetry SDK を使っていたので、これを機に最新化を行いました。一部メソッドなどが名前変更等されていて若干改修が必要でした。たとえば古の「label」を現行の「attribute」に直す必要などもありました。ソフトウェアは生き物なので塩漬けにせずちゃんとメンテナンスしましょう。と言う至極当たり前の課題も見えました。
今回は OpenTelemetry "最初の一歩" を踏み出した事例として紹介しました。
意外な会社もモダンな技術を取り入れているんだぞ!アピールも裏テーマだったので、参画しているプロジェクトについても多少触れることができてよかったです。
このセッションを通して、OpenTelemetry 活用の後押しが少しでもできたら幸いです。
他の方々のセッション
当日は自分の番もありあまり集中して聞けなかったのですが、アーカイブで再度拝見しました。いずれのセッションとても勉強になりました。
まずは、@katzchang さんのオープニングから。
otel meetup をこのタイミングで開催した経緯などがありました。たしかに最近 OpenTelemetry 周りの事例とか記事多く出てる印象でした。ISUCON 夏祭りでも otel が注目されていたそうで、やっていき機運の高まりがあったようです。
Connpass のセッションタイトル全て (仮) なのが地味にツボでした。
@ymotongpoo さんの OpenTelemetryのここ4年の流れ は、OpenTelemetry プロジェクト発足や、テレメトリー仕様がどう定義されてきたかの歴史的背景を追体験できてとても面白かったです。2022 年にオンライン開催された Observability Conference 2022 であった OpenTelemetryのこれまでとこれから のセッションの要約・更新版の位置付けと思いますが、こちらも OpenTelemetry の内部コンポーネントなどを詳に解説してくださってるのでオススメです。わたしも Otel 振り返りたいときに何度も見てたので、今回オフラインで同セッション聞けて個人的に胸熱でした。
今後としては、コレクターの stable やプロファイルの仕様策定、Go でのログが注目されます。
@nabeo さんの ヘンリーにおける可観測性獲得への取り組みは、Otel Collector 導入に向けた諸々の検討、コスト面からアーキテクチャまでを詳細に解説していただきとても参考になりました。また、冒頭説明いただいた複雑な業務要件よりシステムも複雑化し、オブザーバビリティが重要という点も説得力があり、自分としても共感が大きかったです。今回 PoC を経て、これから実践投入とのことだったので、今後事例も多く共有してくださる(?!)ことで楽しみです。Otel Collector の現場ノウハウはまだあまり流通してないと思うので、とても勉強になり、我々もやっていきたいというモチベーションになりました。
最後に
Cloud Native Days Fukuoka 2023 の二次会で otel meetup したいと思っているんだよね的な話を主催の方々に聞いて、第一回目で登壇機会いただけるとは思ってなかったので、企画の katzchang さん、ymotongpoo さんには大変感謝です。
懇親会でも多くの Otel 強者の方とお話しでき、実践エピソードも教えていただいたので、次回の otel meetup も盛り上が機運を感じています。楽しみです!
あとは今後のじぶんにですが、パネルディスカッションちゃんと頑張りましょう。以上です。
おまけ:感想など
事例紹介ネタでの登壇初めてだったので、直前まで「この知見は共有の価値あるな」と「これ聞いて誰の何になるの?」の情緒を行き来してました。X でのポジティブな反応は励みになりました。
Discussion