📝

サービス監視にdatadogを入れた

2023/06/07に公開

目的

エラー監視サービスを導入することで、ウェブサービス内で発生するエラーや障害を早期に検知することができます。システムに問題がある場合、エラー監視サービスは自動的にアラートや通知を送信し、開発者や運用チームに問題を迅速に把握させます。これにより、問題の修正や対応を早めることができます。

railsアプリのログ管理に適したツールは何か

Railsに使う場合、使いやすい監視ツールはDatadogまたはNew Relicなどがあります。

Datadogは、Railsアプリケーションのパフォーマンス、トレース、ログなどの監視を行うための統合プラットフォームを提供しています。また、DatadogのRubyコンフィグレーションライブラリを使用することで、Railsアプリケーションのパフォーマンス監視を簡単に設定できます。

New Relicも、Railsアプリケーションのパフォーマンス監視やトレース、エラー追跡、ログ分析などを行うためのプラットフォームを提供しています。また、New RelicのRuby gemを使用することで、Railsアプリケーションを監視することができます。

Splunk、Zabbix、Nagiosはいずれも優れた監視ツールですが、Railsアプリケーションの監視に特化しているわけではないため、DatadogやNew Relicよりも使いやすさや効果が劣る可能性があります。ただし、これらのツールには独自の利点があるため、特定のニーズに応じて選択することもできます。

datadogを選択した理由

Datadogは、クラウドやオンプレミスのITインフラストラクチャをモニタリングし、洞察を提供するための総合的な監視プラットフォームであり、以下のような利点があります。

  • データ収集
    多数のデータソースからデータを収集できます。サーバー、コンテナ、アプリケーション、ログ、トレース、ネットワーク、セキュリティ、クラウドサービスなどのデータを収集し、一元化されたビューを提供します。

  • 分析機能
    高度な分析機能を提供しており、データの集計、可視化、異常検出、予測分析、トレース分析などができます。

  • 導入
    簡単にインストールでき、直感的なUIやダッシュボードで使用できます。また、APIを介して自動化されたインフラストラクチャ管理をサポートしています。

  • リアルタイムのアラート通知
    リアルタイムでアラート通知を行い、問題が発生したときに即座に対処できます。

機能紹介

よく使う機能をいくつか紹介します

ダッシュボード



データを一目で見れるダッシュボードが非常に多く用意されています。
いずれも自分で設定する必要はなく、datadogエージェントを入れるだけで自動でデータを取得してグラフ化してくれるため重宝しています。

ログ


サービスのログをまとめて一か所で検索できます。
ログの種類もrailsのログ、httpアクセスログなどでグループ分けして管理でき、jsonフォーマットのログの要素を指定して検索などもできるため、非常に便利です。
文言でフィルターを設定してアラートを通知することもできるため、エラーの通知はdatadogのログ管理機能を使って行っています。

外形監視


システムにアクセスできるか確認するために数分おきにHTTPリクエストを投げて、正しいレスポンスが返ってきているかを監視できます。
サービスのトップページが見れるかという基本的なものもありますが、rails内部から外部のAPIを使っている場合にそのサービスが実はエラーを起こしていないかなどの監視を行っています。

株式会社マインディア テックブログ

Discussion