😎

Datadog 大阪セミナー参加レポート

に公開


関西では初開催となる「DATADOG LIVE」大阪セミナーに参加してきました。
2025年にDatadogが大阪事業所を開設するようです! おめでとうございます! 関西のユーザーにとって、これは嬉しいニュースですね!

セミナーでは、Datadogが注力する「AI」と「クラウドセキュリティ」の最新機能、
そして国内の様々なトップ企業によるリアルな活用事例が紹介されました。
本記事では、そのセッションの要点をレポートします。

Datadogが強化する2大領域:「AI Ops」と「クラウドセキュリティ」

Datadogは「インフラメトリクス」「APM」「ログ管理」「クラウドセキュリティ」「AI」といった領域を重要な柱としていますが、その中でも特に「AI」と「クラウドセキュリティ」の分野を急速に強化しています。
アジャイル開発やテクノロジーの複雑化により、現代のシステム運用では以下のような課題が生まれています。

  • アラート対応が複雑化し、人的リソースが不足している。
  • 横断的な問題解決が難しく、根本原因の特定に時間がかかる。

これらの課題を解決する鍵が、AIとセキュリティの進化です。

1. AI Ops:Bits AI SREによる根本原因の特定と自動修復

DatadogのAI Ops製品「Bits AI SRE」は、まさにこの課題を解決するために設計されています。

  • 根本原因の究明
    • 複雑な障害発生時、AIが過去の経験から学習し、根本原因を探り当てます。
  • ブラックボックス化しない
    • 従来の運用では、原因特定に至るまでのログや仮説を運用者が対応していてブラックボックスになることも少なからずあるかと思いますが、「Bits AI SRE」では原因特定までのプロセスを可視化できます。

2. LLMオブザーバビリティ:急速に進化するAIそのものの可視化

さらに、AIを「使う」だけでなく、AI(特にLLM)「そのもの」を監視する「LLMオブザーバビリティ」も急速に進化しています。

  • ハルシネーションの検知
    • LLMが事実に基づかない回答(ハルシネーション)をしていないかを判断。
  • コストと遅延の追跡
    • トークンの使用量を追跡してコストを管理したり、LLMの応答遅延を追跡したりできます。
  • 新たな攻撃への対策
    • 「プロンプトインジェクション」のような新しい攻撃手法にも対応します。

導入企業が語る!リアルなDatadog活用事例

セッション後半では、国内企業による具体的な活用事例が紹介されました。特に印象的だった4つのアプローチをご紹介します。

1. 事例A:「ビジネスチーム」を巻き込んだダッシュボード活用

BtoC向け会員サービスを運用するある大手エネルギー企業の事例です。
当初、障害発生がエンジニアにしか分からず、クレーム電話でCS(カスタマーサポート)の初動が遅れるという課題がありました。

  • 取り組み
    • エンジニアだけでなく、ビジネスチームやCSも含む「全てのチーム」が理解できる統一ダッシュボードを作成。
  • 成果
    • 会話がスムーズになり、障害状況が即座に共有されるように。さらに、ビジネスメンバーから能動的に「ここのインフラが不安定だ」といったフィードバックがプラットフォームチームに寄せられるようになりました。

2. 事例B:「70のAWSアカウント」をタグで集約・関連付け

続いては、多数のプロダクトを抱え、AWSアカウントが70にも分散していたある大手メディア企業の事例です。

  • 課題
    • アカウントの切り替えが大変。データが分散し、横断的な追跡が困難。
  • 取り組み:集約
    • Datadogに全データを集約し、アクセスする場所を一本化。
  • 関連付け
    • env, service, version といった共通の「タグ」を徹底。
  • 成果
    • タグのおかげで、フロントエンドからバックエンドまで横断的に追跡可能に。「バージョンを上げたらエラーレートが跳ね上がった」といった原因特定が瞬時に行えるようになりました。

まずは「ログ」「APM」「メトリクス」の3つを整備するだけでも効果は絶大とのことです。

3. 事例C:「価値の示しにくい運用監視」のDXと組織の壁

ある企業グループからは、レガシーな環境や組織の壁をどう乗り越えるかというテーマが語られました。

  • 課題
    • 運用監視は「非機能要件」であり、ビジネス価値を示しにくい。さらに、システムの複雑化による「技術の壁」や、人材不足・部門間のサイロ化といった「組織と人の壁」が存在していました。
  • Datadogの価値
    • 機能ごとの課金体系であるため、「スモールスタート」でPoC(概念実証)を行いやすい。まずは小さな成功体験を積んで価値を証明し、徐々に拡大していくアプローチが有効です。

4. 事例D:マイクロサービス化と「文化の再生」

巨大なレガシーシステムをモダナイゼーションし、マイクロサービス化を進める企業の事例も非常に示唆に富むものでした。

  • 課題
    • モノリス時代はログを見れば十分だったが、分散システムでは「分散トレース」が必須に。しかし、当初は「使いたいチームだけが稟議を上げて使う」という文化で、利用のハードルが高かった。
  • 取り組み(文化の再生)
    • ハードルを下げる
      • k8s基盤にDatadog設定を組み込み、アプリチームが意識せずとも使えるように整備。
    • 窓口の整備
      • 使い方記事の整備や、チームに寄り添ったサポート窓口を設置。
    • 障害時こそ普及のチャンス
      • 障害発生時、DatadogのスクリーンショットをSlackに貼り付け、「こうやって使うんだ」とジュニアメンバーにも積極的に普及。

まとめ

今回の「DATADOG LIVE」大阪セミナーは、Datadogの「AI」と「セキュリティ」における最新の進化をキャッチアップできただけでなく、国内企業がいかにしてオブザーバビリティを組織に根付かせているかを学べる貴重な機会となりました。
こういった他社様の事例から自社での開発に活かせそうな気づきが多く、参加して大変良かったです!!(そして余談ですが、セッション間の休憩で提供されたご飯がとても美味しかったです。素晴らしい学びと美味しい食事に、心もお腹も満たされた一日でした。)

Discussion