🤖
週末やってみるシリーズ Databricks導入マスターへの道:1カ月学習ロードマップ
Databricks導入マスターへの道:1カ月学習ロードマップ
※ 目指せMopsアーキテクチャというお題を自分に課して、知っているMA,CDP以外で必要そうなプロダクトを勉強する(Lakehouse)
アウトプット
✅ 目標
SalesforceやGCPの知見を活かしつつ、Databricksの基本概念・実装・操作を1カ月で習得し、Mopsとしての素養獲得を目指す。
📅 WEEK 1:Databricks入門 & 概要理解
目標
- Databricksの概念や使用意義を理解
- Databricksノートブックでデータを読み込める
やること
- Lakehouseアーキテクチャを図にしてみる
- CSVファイルの読み込み、head(5)を表示
- Databricks Community Editionにサインアップ
📅 WEEK 2:Spark基礎 & データ操作
目標
- Spark DataFrameの基本操作を身に付ける
- 簡単な集計・グルーピングを実装
やること
- select, filter, groupBy, join の操作を覚える
- PandasとSparkの違いを体感
- SQLでも同じ操作ができることを試す
📅 WEEK 3:Delta Lake & ETL実装
目標
- Delta Lakeの概念を理解
- ETLフローをノートブックで作成
やること
- Deltaでデータを保存、Parquetと比較
- UPSERT処理を覚える
- ETLステップのユースケースを整理
📅 WEEK 4:BI構築 & Salesforce連携想定
目標
- ダッシュボードの作成
やること
- Databricks SQLでレポート作成
ゴールするために
- まずは手を動かす(ほぼコピペでもいい)
Discussion