【資格】文系非エンジニアがProfessional Data Engineer(PDE)に2週間で合格した話(受験方法、勉強方法、感想)
1. はじめに
株式会社 Hogetic Labの古畑です。
先日、Google Cloudの認定資格の1つであるProfessional Data Engineerを取得したので、その振り返りと記録を残したいと思います。
引用元:credly Professional Data Engineer Certification
その他の資格について興味のある方は、以下の記事も合わせてご覧ください。
筆者経歴
- 文系学部卒。前職でビジネス職として入社後、データアナリストに転向
- 受験当時、Google Cloudの認定資格は2つ取得済
- 主にBigQueryを業務内で利用しているものの、データエンジニアとしての業務経験はほぼなし
受験のきっかけ
- Googleのパートナー企業で勤務しているため、従業員の有資格数が評価されること
-
Google Cloud Partner Top Engineerというプログラムの審査基準の1つであること
- その後取得しました
2. Professional Data Engineerの概要
引用元:Complete Guide To Google Cloud Certification: Overview, Levels, And Benefits
Professional Data Engineer はGoogle Cloudの上級認定資格で、データ駆動型の意思決定を支援するクラウドベースのデータソリューションを設計、構築、運用する能力を認定する資格です。
データエンジニアとしてのスキルや知識を証明することで、クラウド上でのデータ処理における専門性を示します。
出題範囲
- データ処理システムの設計
- データの取り込みと処理
- データの保存
- 分析用データを準備して使用する
- データワークロードの維持と自動化
Professional Data Engineer は、2024年1月に試験範囲が改訂されました。
追加された範囲についても多く問題が出たので、サービス内容とベストプラクティスは事前に確認しておくと良いと思います。
削除された範囲
- 機械学習関連の部分
- ML関連のAPI (Vision API、Speech API、AutoML)
- 機械学習モデルの再トレーニング(AI Platform Prediction、AI Platform Training、BigQuery ML、Kubeflow、Spark ML)
追加された範囲
- データメッシュ関連(Dataplex、Data Catalog)
- Datastream
- Dataform
- Workflows
- Analytics Hub
- BigQuery Omni、BigLake
試験要項
- 試験時間:120分
- 受験料:$200(税別)
- 試験言語:英語・日本語
- 試験形式:50問の選択式
- 実施形式
- 遠隔監視オンライン試験
- テストセンターにおけるオンサイト監視試験
- 有効期限:2年
公式の最新情報については、こちらからご確認ください。
3. 受験方法
Professional Data Engineerを受験するには、次の手順で申し込みます。
- Professional Data Engineerにアクセスし、「登録」ボタンを押す
- Google Cloud Webassessorアカウントでログインする
- アカウントがなければ新規に作成する
- 「試験の申し込み」のページにアクセスし、Professional Data Engineer資格の欄から「遠隔監視」か「オンサイト監視」を選択する
- 遠隔監視であれば希望の日程、オンサイト監視であれば希望の試験会場と日程を選択する
- お支払い情報を確認し、申し込む
私は今回テストセンターでオンサイト監視試験を受験しました。
4. 学習資源
今回Professional Data Engineerを受験するにあたり、私が使用した学習資源について記載します。
公式模擬問題
公式が提供する模擬問題です。
問題形式や実際の試験で出題される可能性のあるコンテンツの例に慣れるため使用しました。
本番でも概ね同様の形式で出題されましたが、追加された範囲の問題は少なかったです。
Google Cloud Skills Boost
公式が提供する学習資源です。
さまざまなジャンルごとに学習コースが提供されており、Professional Data Engineerについても受験に向けた専用のコースが用意されています。
単に動画講義を視聴するにとどまらず、「ラボ」と呼ばれるコンテンツが用意されており、専用のGoogle Cloud 環境で各ツールの動作を検証することもできます。
非常にボリューム満点な教材のため、標準受講時間が数十時間となっています。
「最短で試験に合格する」という目的の方には合いませんが、学んだことを業務で活かす上ではとても役に立つ教材だと思います。
試験対策ブログ
クラウドエース様がProfessional Data Engineer 試験対策のブログ記事を執筆されています。
試験の出題範囲や概要が1ページにまとまっており、試験直前の知識総ざらいにとても良い記事だと思います。
特に追加された範囲については、このページを見ていたことで本番何度も助けられました。
非公式模擬問題集
非公式のものになりますが、udemyやAmazonでは模擬問題集がいくつか発売されています。
本番でも本問題集とかなり近しい問題がいくつか出題されており、取り組んでおくと余裕を持って本番に臨めると思います。
Google Cloud(無償枠)
教科書の解説がいまいちよく分からない場合など、実際に触ってみることで理解できることがしばしばありました。
私は業務上ですでにGoogle Cloud を利用していたためそちらを活用しましたが、利用していない方に対しても無償枠が用意されています。
5. 勉強方法
私はProfessional Data Engineerを目指すにあたり、以下のようなスケジュールで勉強しました。
- まず公式模擬問題を1周解き、試験の雰囲気を掴む(1時間)
- Google Cloud Skills Boostに取り組み、出題範囲の理解を深める(5日)
- 模擬試験に取り組む(1週間)
- 1周目は問題を解かず、問題・選択肢と解答解説を読み込む
- (不)正解の選択肢が(不)正解である理由を説明できる状態にする
- 2周目は問題を解く
- 「自信を持って正解できた」問題にマークをつける
- 3周目はマークのついていない問題を解く
- ここで間違えた問題は教科書の該当部分に戻り、理解できるまで読む
- 1周目は問題を解かず、問題・選択肢と解答解説を読み込む
- 教科書や模擬試験の解説で理解できなかった部分をGoogle Cloudで実際に確認する(1日)
- 試験直前にクラウドエース様の記事を読み、知識の総ざらいを行う(1時間)
もちろんこれが正解というものではありませんので、学習法は個人にあったやり方を模索してみてください。
6. 感想
全体的な印象
試験内容は非常に実践的で、Google Cloud Platform を活用したデータソリューションの設計や運用に関する深い知識が求められました。
単なる知識の暗記ではなく、実務での経験や、複数のソリューションから最適な選択をする能力が重視されていると感じました。
技術的な深さ
データ処理(ETL/ELT)やストレージ設計に関する詳細な質問が多く、各サービスの理解が重要でした。
また、分散処理やスケーラビリティの設計についても問われるため、基礎を押さえた上で、応用力が試されます。
試験範囲の幅広さ
セキュリティ設計(IAM やデータ暗号化)やデータベース設計(Cloud Spanner や Firestore)まで、幅広い分野から出題されました。
複数の領域を広く深くカバーするため、事前の学習計画が鍵となります。
トリッキーな選択肢
問題によっては、非常に似た選択肢や、実行可能でも実務上不適切(手間・コストがかかりすぎるなど)な選択肢が並ぶため、どのソリューションが最も適切かを選ぶのに苦労しました。
各サービスの強みと弱みを正確に把握しておく必要があります。
7. まとめ
以上、Professional Data Engineerの概要、受験方法、学習方法などについて個人的な考えを交えて記載しました。
皆様の参考になる情報が見つかれば幸いです。
最後に宣伝ですが、弊社はGoogleの生成AIパートナーとして、Google Cloudの活用およびデータ分析の民主化に取り組んでいます。
データアナリスト・データエンジニアをはじめ各ポジションでの採用も行っておりますので、ご興味がある方はチェックしてみてください。
Discussion