🤖

週末やってみるシリーズ Databricks導入マスターへの道:1カ月学習ロードマップ

に公開

Databricks導入マスターへの道:1カ月学習ロードマップ

※ 目指せMopsアーキテクチャというお題を自分に課して、知っているMA,CDP以外で必要そうなプロダクトを勉強する(Lakehouse)

アウトプット

https://note.com/mellow_launch/n/n813fc40a8400?sub_rt=share_pb

✅ 目標

SalesforceやGCPの知見を活かしつつ、Databricksの基本概念・実装・操作を1カ月で習得し、Mopsとしての素養獲得を目指す。


📅 WEEK 1:Databricks入門 & 概要理解

目標

  • Databricksの概念や使用意義を理解
  • Databricksノートブックでデータを読み込める

やること

  • Lakehouseアーキテクチャを図にしてみる
  • CSVファイルの読み込み、head(5)を表示
  • Databricks Community Editionにサインアップ

📅 WEEK 2:Spark基礎 & データ操作

目標

  • Spark DataFrameの基本操作を身に付ける
  • 簡単な集計・グルーピングを実装

やること

  • select, filter, groupBy, join の操作を覚える
  • PandasとSparkの違いを体感
  • SQLでも同じ操作ができることを試す

📅 WEEK 3:Delta Lake & ETL実装

目標

  • Delta Lakeの概念を理解
  • ETLフローをノートブックで作成

やること

  • Deltaでデータを保存、Parquetと比較
  • UPSERT処理を覚える
  • ETLステップのユースケースを整理

📅 WEEK 4:BI構築 & Salesforce連携想定

目標

  • ダッシュボードの作成

やること

  • Databricks SQLでレポート作成

ゴールするために

  • まずは手を動かす(ほぼコピペでもいい)

Discussion