Open8
Snowflake + dbtパフォーマンスチューニング
エンドユーザーが使うモデルではclustering keyの設定は大事になってきそうに見える
snowflakeでできるclusteringのメリデメ
- natural clustering
- eventが発生順にinsertされて、自然とinsert_atなどのカラムでclusteringされる
- pros
- 特になし
- cons
- 再集計時にソートしてあげた方がいい
- insert_at以外でのクエリには効かない
- snowflake auto clustering
- alter table my_table cluster by (column_to_cluster_by);
- pros
- 楽
- cons
- clusteringのコストが改善されるパフォーマンスを上回る可能性がある
- manual sorting
- CTAS + order byでsortしなおす
- pros
- 低コスト
- cons
- 手間がかかる
- 他に走るDMLに注意が必要
検証してる記事があった
micro partitionについて