GCP認定 Professional Data Engineer試験に合格するまでに取り組んだこと
はじめに
2024年1月5日の周知によると、2024年1月30日から日本語でのPDE試験の範囲が新しくなるそうです。
機械学習モデルの運用に関する問題よりもデータエンジニアとしての役割を問う問題を重要視するとのことでした。
試験ガイドについては下記を参照してください。
本記事は私が試験に合格した2023年12月時点での対策について説明しています。
私が合格するまでに要した時間は11日間(30時間程度)です。
今から学習を始め、試験範囲が更新される前に資格を取得するのも一つの手かと思います。
忙しい人向け
下記の問題集を9割解けるように学習。
1.【最短攻略】Google Cloud 認定 Professional Data Engineer 模擬問題集
2.公式が提供する模擬試験
3. Preparing for Your Professional Data Engineer Journey - 日本語版
受験のきっかけ
GCPを活用したMLOpsを業務で実践したいと考えたことがきっかけでした。
自身のプロダクトの一部にGeminiを取り込もうとしていたのですが、GCPに関して全然知識がなかったため、いい機会だと思い受験しました。
筆者のレベル
普段はGCPではなくAWSで実務を行っています。
AWS SAAは取得していたためクラウドに関する基礎知識は備わっています。
大学院では深層学習を専門としており、G検定、E資格を2年前に取得済。
取り組んだ内容
GCPのサービス全般に関する基本的な用語を把握する
まずUdemyでGoogle Cloud Digital Leader模擬試験問題集の回答を流し読んで基本的な用語について確認しました。
GCP認定試験の受験の作法について知らないこともあったため、GCP CDL試験も受験しました。(合格しました!)
ここまでは土日(10時間程度)で行いました。
【最短攻略】Google Cloud 認定 Professional Data Engineer 模擬問題集を解く
Ggenの試験対策記事が非常に参考になりました。
7割程度解けるようになると、組織やIAM、機械学習やPIIに関する要綱はだいぶ答えられようになるのではないでしょうか。
データパイプラインの構築方法やデータベースの選択方法に関しては設問に応じたソリューションがピンとくるようになると思います。
試験範囲におけるデータパイプラインやデータベースの部分に関しては細かい部分も問われるため、ほかの問題集も解きます。
模擬試験とPreparing for Your Professional Data Engineer Journey - 日本語版
これらを学習すると“ストリーミングパイプラインにおいてどのウィンドウ関数を使用するとよいか”といった、特定のシチュエーションにおける最適解を問う問題にも答えられるようになります。
まとめ
GCP認定を取得したことでサービスへの理解がより深まり、データパイプラインのアーキテクチャ構成を考えられるようになりました。
次は実務でGCPを活用してMLOpsをやっていきたいです!
ここまで読んでいただきありがとうございました👐
Discussion