🔔 本の下書きプレビューをシェアできるようになりました

Open2ヶ月前にコメント追加16

DuckDB メモ v2

 前提
自社製品では JSONL 形式のログが色々出力される
自社製品は分散システムなためログも分散する
自社サービスのログファイルは大きくても無圧縮で 1 日 100 GB いかない程度

Fluent Bit で gzip で圧縮した JSONL 形式のログを S3 互換オブジェクトストレージ (以下 S3) に保存する


 モチベーション

自社パッケージ製品のクラウドサービスで、顧客にログ解析情報を提供したい
その仕組みを OSS 化して、自社パッケージ製品を利用している顧客が利用できるようにしたい

S3 から gzip で圧縮された JSONL ログ(複数) を取得して、横断的に解析したい
自動でスキーマは作成してほしい
解析結果を DuckDB ファイルとして出力し S3 へ保存したい
出力した DuckDB ファイルを DuckDB-Wasm で読み込ませたい

コストを低くしたい
転送量が安い S3 を利用すればかなりコストが下げられる

顧客のブラウザ上だけで解析結果を自由にいじれるようにしたい
毎回 API 叩かれたくない

一定期間でファイルを削除するのも S3 なら気軽にできる
解析が DuckDB + S3 で、表示が DuckDB-Wasm + S3 スケールが容易になる
DuckDB を利用する事で自社以外でも同じ解析の仕組みが利用できるようになる
自社製品と関連付けた解析システムとして OSS にできる



 選定理由
DuckDB
SQL で書きたい
ライセンスが MIT
安定性を優先している
https://duckdb.org/why_duckdb

https://duckdblabs.com/
DuckDB-Wasm がある
ブラウザで完結したい
サービス側の負荷を最小限にしたい


S3 互換オブジェクトストレージ
安い
汎用的
永続化



 ざっくり
Fluent Bit から gizp で圧縮した JSONL を S3 に保存する
https://docs.fluentbit.io/manual/pipeline/outputs/s3

DuckDB から S3 へ圧縮されたファイルを取得する
create table egg as select * from read_json_auto('s3://spam/egg.jsonl.gz');
URL にはワイルドカードが使用可能
https://duckdb.org/docs/extensions/httpfs/s3api#glob


読み込んだ結果にフィルターをかけて必要なテーブルだけが入った duckbox 形式で出力する
EXPORT DATABSE を利用する
duckdb ではなく duckbox らしい
https://duckdb.org/docs/sql/statements/export.html

読み込んだ結果にフィルターかけて、テーブルを Parquet 形式で出力する
https://duckdb.org/docs/guides/file_formats/parquet_export.html

DuckDB-Wasm で S3 からファイルをダウンロードする
DuckDB-Wasm は aws 拡張が使えず s3:// は利用できない
Parquet を HTTPS 経由でダウンロードする
S3 の署名付き URL を利用する

ATTACH を利用する
https://duckdb.org/docs/guides/network_cloud_storage/duckdb_over_https_or_s3#attaching-to-a-database-over-the-s3-api
実際に運用する場合、署名付き URL を利用する


DuckDB-Wasm の情報をグラフライブラリを利用して描画する
https://github.com/duckdb/duckdb-wasm



 おまけ
sqlc-duckdb の開発を検討中
DuckDB のパーサーを利用する
Go / TypeScript / Python 向けに出力する

Hidden comment

 DuckDB 処理フロートリガーで情報を渡して、それに沿った duckdb ファイルを出力する仕組み

 systemd/Timers 案採用
定期的にジョブキューを見に行って、ジョブがあったら DuckDB を実行する仕組み
S3 から集計して DuckDB ファイルを吐き出して S3 に保存
ジョブが完了するタイミングで Postgres のレコードを更新する

Postgres のジョブキューモドキを利用する
https://zenn.dev/shiguredo/articles/postgresql-skip-locked
既にサービスにある仕組み

ジョブワーカーを増やすだけでスケールすることができる

 GitHub Actions 案不採用
キューに入れて処理するなら GitHub Actions を使えるのではないか？
https://docs.github.com/ja/actions/writing-workflows/choosing-when-your-workflow-runs/events-that-trigger-workflows#repository_dispatch

Self-hosted を利用すれば好き放題できる
https://github.com/opt-nc/setup-duckdb-action

 自社サービスで利用する際のコストかなり雑に計算してます
S3 互換オブジェクトストレージ
Akamai Connected Cloud の Object Storage を利用
https://www.linode.com/products/object-storage/

250 GB で月 5 ドル
転送量は 1 TB 無料枠ありで 1 TB で月 5 ドル
API の回数などは課金対象ではない
一定期間でログは削除
14 日 or 30 日をイメージ


ジョブワーカー
CPU 2 コア メモリ 4 GB の場合
月 36 ドル

メモリが欲しい場合
https://www.linode.com/pricing/#compute-high-memory
月 60 ドルでメモリ 24 GB のマシンが借りれる



 ざっくりコスト計算転送量に 1 TB 利用
0

ディスク容量 1 TB
20 ドル

ジョブワーカー
既にある

月 20 ドルの追加で実現できそう。

 pg_duckdbduckdb/pg_duckdb: DuckDB-powered Postgres for high performance apps & analytics.
DuckDB の仕組みを Postgres で利用できるようにする Postgres 拡張。

参考

Distributed Dashboarding with DuckDB-Wasm - Xebia

Secrets Manager

https://duckdb.org/docs/configuration/secrets_manager

Cloudflare R2

CREATE SECRET secret5 (
    TYPE R2,
    KEY_ID 'AKIAIOSFODNN7EXAMPLE',
    SECRET 'wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY',
    ACCOUNT_ID 'my_account_id'
);

 to_timestamptimestamp への変換。
https://duckdb.org/docs/sql/functions/timestamp#to_timestampdouble

 time_bucketTimescaleDB にある time_bucket そのまま。
https://duckdb.org/docs/sql/functions/timestamp#time_bucketbucket_width-timestamp-origin
time_bucket(INTERVAL '2 weeks', TIMESTAMP '1992-04-20 15:26:00', TIMESTAMP '1992-04-01 00:00:00')

CREATE SECRET に Akamai Connected Cloud の Object Storage を利用する

ENDPOINT を明示的に指定するだけでよい
あとは KEY_ID に Access Key 、SECRET に Secret Key を指定する

CREATE SECRET secret (
    TYPE S3,
    KEY_ID '...',
    SECRET '...',
    ENDPOINT 'jp-osa-1.linodeobjects.com',
);

EXPLAIN ANALYZE

JSONL / JSONL (gzip) / Parquet (zstd) のファイルサイズ (バイト)

このログは時雨堂の WebRTC SFU Sora が出力するログの1つです。

クライアント側で 15 秒間隔で取得している WebRTC 統計情報を WebRTC DataChannel 経由で Sora へ吸い上げて、Sora が JSONL として出力しています。

101_452_550 rtc_stats.jsonl
 10_864_324 rtc_stats.jsonl.gz
  2_390_235 rtc_stats.parquet

jsonl 読み込みからの parquet ファイルの生成

D EXPLAIN ANALYZE create table rtc_stats as select * from read_json('rtc_stats.jsonl');
┌─────────────────────────────────────┐
│┌───────────────────────────────────┐│
││    Query Profiling Information    ││
│└───────────────────────────────────┘│
└─────────────────────────────────────┘
EXPLAIN ANALYZE create table rtc_stats as select * from read_json('rtc_stats.jsonl');
┌────────────────────────────────────────────────┐
│┌──────────────────────────────────────────────┐│
││              Total Time: 0.281s              ││
│└──────────────────────────────────────────────┘│
└────────────────────────────────────────────────┘
┌───────────────────────────┐
│           QUERY           │
│    ────────────────────   │
│           0 Rows          │
│          (0.00s)          │
└─────────────┬─────────────┘
┌─────────────┴─────────────┐
│      EXPLAIN_ANALYZE      │
│    ────────────────────   │
│           0 Rows          │
│          (0.00s)          │
└─────────────┬─────────────┘
┌─────────────┴─────────────┐
│   BATCH_CREATE_TABLE_AS   │
│    ────────────────────   │
│           1 Rows          │
│          (0.14s)          │
└─────────────┬─────────────┘
┌─────────────┴─────────────┐
│         TABLE_SCAN        │
│    ────────────────────   │
│    Function: READ_JSON    │
│                           │
│        Projections:       │
│       connection_id       │
│             id            │
│           label           │
│         timestamp         │
│            type           │
│          version          │
│         node_name         │
│         session_id        │
│            role           │
│         channel_id        │
│         bundle_id         │
│         client_id         │
│        multistream        │
│         spotlight         │
│         simulcast         │
│        log_written        │
│          rtc_data         │
│           rtc_id          │
│       rtc_timestamp       │
│          rtc_type         │
│                           │
│         83911 Rows        │
│          (0.25s)          │
└───────────────────────────┘
D EXPLAIN ANALYZE copy rtc_stats to 'rtc_stats.parquet' (FORMAT parquet, COMPRESSION zstd);
┌─────────────────────────────────────┐
│┌───────────────────────────────────┐│
││    Query Profiling Information    ││
│└───────────────────────────────────┘│
└─────────────────────────────────────┘
EXPLAIN ANALYZE copy rtc_stats to 'rtc_stats.parquet' (FORMAT parquet, COMPRESSION zstd);
┌────────────────────────────────────────────────┐
│┌──────────────────────────────────────────────┐│
││              Total Time: 0.320s              ││
│└──────────────────────────────────────────────┘│
└────────────────────────────────────────────────┘
┌───────────────────────────┐
│           QUERY           │
│    ────────────────────   │
│           0 Rows          │
│          (0.00s)          │
└─────────────┬─────────────┘
┌─────────────┴─────────────┐
│      EXPLAIN_ANALYZE      │
│    ────────────────────   │
│           0 Rows          │
│          (0.00s)          │
└─────────────┬─────────────┘
┌─────────────┴─────────────┐
│     BATCH_COPY_TO_FILE    │
│    ────────────────────   │
│           1 Rows          │
│          (0.07s)          │
└─────────────┬─────────────┘
┌─────────────┴─────────────┐
│         TABLE_SCAN        │
│    ────────────────────   │
│         rtc_stats         │
│                           │
│        Projections:       │
│       connection_id       │
│             id            │
│           label           │
│         timestamp         │
│            type           │
│          version          │
│         node_name         │
│         session_id        │
│            role           │
│         channel_id        │
│         bundle_id         │
│         client_id         │
│        multistream        │
│         spotlight         │
│         simulcast         │
│        log_written        │
│          rtc_data         │
│           rtc_id          │
│       rtc_timestamp       │
│          rtc_type         │
│                           │
│         83911 Rows        │
│          (0.04s)          │
└───────────────────────────┘
D EXPLAIN ANALYZE select * from parquet_scan('rtc_stats.parquet');
┌─────────────────────────────────────┐
│┌───────────────────────────────────┐│
││    Query Profiling Information    ││
│└───────────────────────────────────┘│
└─────────────────────────────────────┘
EXPLAIN ANALYZE select * from parquet_scan('rtc_stats.parquet');
┌────────────────────────────────────────────────┐
│┌──────────────────────────────────────────────┐│
││              Total Time: 0.0908s             ││
│└──────────────────────────────────────────────┘│
└────────────────────────────────────────────────┘
┌───────────────────────────┐
│           QUERY           │
│    ────────────────────   │
│           0 Rows          │
│          (0.00s)          │
└─────────────┬─────────────┘
┌─────────────┴─────────────┐
│      EXPLAIN_ANALYZE      │
│    ────────────────────   │
│           0 Rows          │
│          (0.00s)          │
└─────────────┬─────────────┘
┌─────────────┴─────────────┐
│         TABLE_SCAN        │
│    ────────────────────   │
│         Function:         │
│        PARQUET_SCAN       │
│                           │
│        Projections:       │
│       connection_id       │
│             id            │
│           label           │
│         timestamp         │
│            type           │
│          version          │
│         node_name         │
│         session_id        │
│            role           │
│         channel_id        │
│         bundle_id         │
│         client_id         │
│        multistream        │
│         spotlight         │
│         simulcast         │
│        log_written        │
│          rtc_data         │
│           rtc_id          │
│       rtc_timestamp       │
│          rtc_type         │
│                           │
│         83911 Rows        │
│          (0.09s)          │
└───────────────────────────┘

jsonl.gz からの読み込み

D EXPLAIN ANALYZE create table rtc_stats as select * from read_json('rtc_stats.jsonl.gz');
┌─────────────────────────────────────┐
│┌───────────────────────────────────┐│
││    Query Profiling Information    ││
│└───────────────────────────────────┘│
└─────────────────────────────────────┘
EXPLAIN ANALYZE create table rtc_stats as select * from read_json('rtc_stats.jsonl.gz');
┌────────────────────────────────────────────────┐
│┌──────────────────────────────────────────────┐│
││              Total Time: 0.572s              ││
│└──────────────────────────────────────────────┘│
└────────────────────────────────────────────────┘
┌───────────────────────────┐
│           QUERY           │
│    ────────────────────   │
│           0 Rows          │
│          (0.00s)          │
└─────────────┬─────────────┘
┌─────────────┴─────────────┐
│      EXPLAIN_ANALYZE      │
│    ────────────────────   │
│           0 Rows          │
│          (0.00s)          │
└─────────────┬─────────────┘
┌─────────────┴─────────────┐
│   BATCH_CREATE_TABLE_AS   │
│    ────────────────────   │
│           1 Rows          │
│          (0.13s)          │
└─────────────┬─────────────┘
┌─────────────┴─────────────┐
│         TABLE_SCAN        │
│    ────────────────────   │
│    Function: READ_JSON    │
│                           │
│        Projections:       │
│       connection_id       │
│             id            │
│           label           │
│         timestamp         │
│            type           │
│          version          │
│         node_name         │
│         session_id        │
│            role           │
│         channel_id        │
│         bundle_id         │
│         client_id         │
│        multistream        │
│         spotlight         │
│         simulcast         │
│        log_written        │
│          rtc_data         │
│           rtc_id          │
│       rtc_timestamp       │
│          rtc_type         │
│                           │
│         83911 Rows        │
│          (0.29s)          │
└───────────────────────────┘

PostgreSQL Extension

PostgreSQL Extension – DuckDB

DuckDB から PostgreSQL を引くことができる。

Secret Manager

登録は Secret Manager を利用する。CREATE SECRET 時に名前も付けられるので付けておいても良い。

CREATE SECRET spam (
    TYPE POSTGRES,
    HOST '127.0.0.1',
    PORT 5432,
    DATABASE postgres,
    USER 'postgres',
    PASSWORD ''
);

ATTACH

Secret Manager で名前を付けている場合は SECRET で指定するのがオススメ
READ_ONLY にすることで事故を防ぐ
AS postgres_db の部分で認識できる

ATTACH '' AS postgres_db (TYPE POSTGRES, SECRET spam, READ_ONLY);

使う

SHOW ALL TABLES; でテーブルが見れる
PostgreSQL 側に egg というテーブルがあるとする

CREATE TABLE egg AS SELECT * FROM postgres_db.egg

これで DuckDB 側に持ってこれる。

DETACH

DETACH postgres_db;

COPY ... TO

テーブルを Parquet 化できる
CREATE TABLE で DuckDB 側に持ってきてからやったほうがいい

COPY egg TO 'egg.parquet (FORMAT Parquet, COMPRESSION zstd)';

 複数ファイル読み込み時のファイル名の取得read_json_auto("log*.jsonl.zst", filename=true)
filename=true を指定することで複数ファイル読み込み時に、ファイル名はカラム名 filename で取れるようになる。
https://duckdb.org/docs/data/multiple_files/overview.html

 Grafana DuckDB Data SourceMotherDuck 手動で開発が進められている模様。
https://github.com/grafana/grafana/issues/80948#issuecomment-2386523407
Hi everyone and thank you for your patience. I'm happy to announce that we signed an agreement with MotherDuck, and the plugin development for DuckDB has already started 🎊
皆さん、お待たせして申し訳ありません。お知らせできることを嬉しく思います。私たちはMotherDuckとの契約を締結し、DuckDB用のプラグイン開発がすでに開始されています🎊

* で使える便利な句

EXCLUDE

* を使った時に特定の値だけ抜いてくれる EXCLUDE

SELECT * EXCLUDE (spam, egg) FROM ham;

spam と egg カラムを除いてくれる。

REPLACE

* を使った時に特定のカラムを置き換えてくれる REPLACE

SELECT * REPLACE (spam / 1_000 AS spam) FROM egg;

spam を 1000 で割った値に置き換えてくれる。

stdin/stdout を利用する

DuckDB では暗号化された Parquet ファイルの読み書きができる

Parquet Encryption – DuckDB

キーは 128 / 192 / 256 のサイズが選べるらしい。暗号方式は AES-GCM が基本っぽい。詳細は DuckDB のソース見ておくことにする。

PRAGMA add_parquet_key('key256', '01234567891123450123456789112345');

COPY tbl TO 'tbl.parquet' (ENCRYPTION_CONFIG {footer_key: 'key256'});

COPY tbl FROM 'tbl.parquet' (ENCRYPTION_CONFIG {footer_key: 'key256'});

FROM が読み込み、TO が書き込み。これは良さそう。

parquet-format/Encryption.md at master · apache/parquet-format