dbtで始めるデータパイプライン構築〜入門から実践〜
無料で読める本
事業会社においてBIやレポート用の分析を担当しているが以下のような状況に該当する人に向けたデータパイプライン構築の入門のための資料です 🧑🏻🦱「BigQuery等のView機能を活用しているが、データの流れを追うのが困難な状態になってしまっている、クエリの実行に時間がかかりBIツールが使いづらい」 👩🏻「専任のデータエンジニアがおらず、前処理をpython等で処理したりするのがリソース調整的に大変」 👱🏻♂️「ロードされたデータに重複があったり、過不足があったりしてデータの品質が担保できていない」 🧑🏻🦰「Digdagやluigiといったデータ変換ツールの独自の仕様を理解しきれておらず使いこなせていない」 ※現時点ではBigQueryを中心に記事を構成してあります、SnowflakeやAmazon Redshift等の様々な分析基盤でもdbtは対応可能です
Chapters
dbtとは?
dbt Cloudのセットアップ
チュートリアル:モデル開発の基本
チュートリアル:テストとドキュメント
チュートリアル:デプロイの設定
Jinjaを使った高度なモデリング
dbtのモデルとは
マテリアライゼーションとは
レガシーなSQLからdbtのSQLへのリファクタリング
dbt向けPythonライブラリのご紹介
dbt Japan User Groupの紹介と執筆者
Community
Author
Topics