Open8
Datadog Pipeline(パイプライン)とは

パイプライン概要
Datadogに送られたログをパースして、情報や属性を抽出しファセットとして利用ができるようになる。パイプラインを経由するログは、フィルターに合致するすべてのプロセッサーが順次適用されていく。
- ファセットの何が嬉しいのか
ログの項目としてなかった属性やタグを付けることによって、データ分析や検索、視覚化をより柔軟に行うことができるようになる。

前処理
ログがパイプラインに入る前に発生する処理。予約済み属性に基づく操作を実行して、属性名にマッピングする。
- 予約済み属性
host, source, status, service, message等
特定の文字列が含まれるか、RFC5424(The Syslog Protocol)で属性が判断される。

パイプライン
フィルタークエリ
パイプラインでは、Live tailプレビューからログがどうフィルターされるのか確認しながら独自のフィルタークエリを作成できる。
(フィルター後にプロセッサがあるため、パイプラインで抽出した属性を絞り込みは不可)

インテグレーションパイプライン
Datadogでインテグレーションを設定している場合、用意されているインテグレーションのためのパイプラインを用いて、各ソースに適した方法でログをパースする。
ユーザー側でインテグレーションパイプラインを設定することもできるが、Datadogで取り込んでいるログを判断して追加している動作をしている。

プロセッサー
フィルタークエリによって選択されたログデータに対して、ログメッセージの変更、新しい属性の追加、既存のデータの変換、カスタムタグの付与などの処理を行う。
ネストされたパイプライン
パイプラインをネストすることによって処理を2段階に分けることができる。第2レベルのフィルタリングを使うことができる。さらなる属性による絞り込みをしたい場合等。

推定使用量
パイプラインごとに推定された使用量のメトリクスを確認することができる。

自分メモ
インテグレーションパイプラインを使えば、ほとんどのサービスは独自のパイプラインを用意してあげる必要はなさそう。アプリケーションのログを収集する場合や分析をしたい場合に独自のパイプラインを作る。

ログ料金
- 取り込み:$ 0.13/ 取り込みまたはスキャンされた GB
- 保持または復元:$ 2.13/ 100 万ログイベント(保持期間15日)
*2024/2 DATADOG SITE: AP