😁

認定資格 Databricks Data Engineer Professional 試験対策

に公開

はじめに

某日系SIerでデータエンジニアをやっております。
先日、Databricksの認定資格であるData Engineer Professionalに合格しました。

これから受験される方に向けて参考になれば幸いです。
https://www.databricks.com/learn/certification/data-engineer-professional

やった対策

おすすめ度を★で表現しております。

Exam Guideの技量要件に対して1問1答を整理する ★★☆

Data Engineer Professionalでは、試験に登場する要素がリスト化されているので各要素に対して1問1答を整理しました。
https://www.databricks.com/sites/default/files/2025-02/databricks-certified-data-engineer-professional-exam-guide-1-mar-2025.pdf

公式ドキュメントの読み込み ★★☆

前項の1問1答を作成する上で、分からない概念については公式ドキュメントを参照しました。
公式ドキュメントについては可能であればなるべく英語で読んでおいた方が良いかもしれないです。(試験は英語なので)

特に、読み込んだドキュメントを記載しておきます。
https://docs.databricks.com/aws/ja/delta/tune-file-size#databricks-での-delta-lake-の自動圧縮
https://docs.databricks.com/aws/ja/delta/data-skipping
https://docs.databricks.com/aws/ja/delta/delta-change-data-feed

UdemyのPractice Exam ★★★

問題演習はPractice Examを利用しました。本番の試験と似ているので回答を覚えるだけでも一定効果はあると感じました。

https://www.udemy.com/course/practice-exams-databricks-data-engineer-professional-k/?couponCode=ST11MT170325G2

講義版はこちら↓
https://www.udemy.com/course/databricks-certified-data-engineer-professional/?srsltid=AfmBOoqAzdmPsrCirGvfkBwEkTEyn2S5EOhqaOUt7l2SQtICMkOfTe_Y&couponCode=ST11MT170325G2

Stream処理の勉強 ★★★

個人的には、試験範囲の中で最難関なのはSpark Structured Streamingだと思います。
こちらに関しては時間を割いて概念の理解に努めました。

Inputとしては下記を利用しました。特に猿田さんの資料はおすすめです。
※あんまりスライドでSturctured Streamingを解説している資料が見当たらなかったので、貴重ですね。
https://spark.apache.org/docs/latest/structured-streaming-programming-guide.html
https://www.slideshare.net/hadoopxnttdata/structured-streaming-the-internal#2

いざ本番

本番試験で個人的に効果的だと思った作戦をリストアップしておきます。

  • 問題文の最後に本質的な問いが記載されているので、最後の1文を読んでから問題文を頭から読む。
  • コード系の問題は先に選択肢を読んでおくとよい。
  • 集中力が切れるので、読んでいて頭に入らないなと思ったらすぐスキップする。

感想

  • 英語力が結構求められる。大体の問題5~8行くらいの英文となっているので、問題演習して慣れておかないときつい。
  • 最後のほうに短めの問いが集中していたので、前半で時間足らなくても焦らずやって大丈夫なはず
  • Bronze→Silverレイヤに関する問いが多かった印象。
  • Apache Spark Developer試験を先に受けたほうがスムーズにProfessionalに入れるかも?

Discussion