📖

Google CloudのPDEの更新がきたので受けてきましたよという話

に公開

what

  • Google Cloud認定資格のProfessional Data Engineerの更新?が迫っていたので受験してきました記録
  • 2年ぶりの試験なので、当時との問題の違いとか個人的な所感とか…を簡単に
  • 受験結果は合格でした!

Professional Data Engineerについて

https://cloud.google.com/learn/certification/data-engineer?hl=ja

  • Google Cloudの認定資格の一つ
  • Google Cloud製品におけるデータエンジニア領域の専門知識やスキルを問う試験
    • 【例】
      • データ分析基盤をGoogle Cloudの製品で構築・運用する場合どんなサービスを使う?
      • データベース移行をする際に、どのようなサービスでどんな機能を利用するべきか?
      • コスト面を考慮したパフォーマンス向上の手法

出題範囲

主に以下の5項目から出題される。
結構ボリューミーなので、詳細はGooleCloud公式の認定試験ガイドを参照↓
https://services.google.com/fh/files/misc/professional_data_engineer_exam_guide_japanese.pdf?hl=ja

【出題範囲一覧】

  • データ処理システムの設計
  • データの取り込みと処理
  • データの保存
  • 分析用データの準備と使用
  • データ ワークロードの管理と自動化

更新とは

  • Google Cloudの認定試験は有効期間がある(運転免許みたいなイメージ)
    • Associate試験: 3年
    • Professional試験: 2年
  • 有効期限が近くなるとGoogleからメールが送られてくる

更新時の受験料について

  • 更新時も受験料はかかる
    • 認定試験合格時に半額クーポンもらえるので、それを利用することもできる

資格更新に向けて

学習期間

  • 約3週間程(6月頭に開始)
    • 仕事終わりや休日を利用

やったこと(大まか)

基本的には、1回目に受験したときと大きく変わらない。

  1. 公式の模擬試験を受ける
  2. 試験対策系のまとめ資料・記事を見る
    3. udemy等にある教材などを利用
    4. クラウドエースさんのまとめ資料もわかりやすく範囲を網羅しているので、全体把握をするのに助かった
  3. 過去問を解く
  4. Google Cloudの公式ドキュメント見る(3と並行)

ただ、細かい点でいくつか変えてみたことがあるので記載。

前回から変えてみたこと

  • 過去問集を英語版にした
    • 自分はUdemyの過去問集をよく利用するが、日本語版の問題集がほとんど更新されてないため、英語版で更新頻度が高いものに変更
    • Chromeの翻訳でも文章理解や問題を解く分には問題なかったため最後まで利用
      • ごく一部の問題だけ、翻訳によっては表現曖昧なものがあったためこの点だけ注意
  • 生成AI使ってみた
    • 受験当時は使っていなかったので、問題の解説に使ってみた
      • Notebook LM
        • 公式ドキュメントの要約やまとめの理解に
        • たまに文章の表現わかりにくものがあったりするのでとても便利
        • 英語のドキュメントもいい感じに日本語翻訳してくれるのでこれもとても助かった
      • Gemini
        • 間違えた問題の解説に
        • たまにプロンプトに書いてない選択肢についても解説してきた
          • 言ってないのにどうしてわかったの
      • たまにChat GPT

勉強・受験して思ったこと

2年ぶりの受験なので、「出題範囲(サービスや機能)についてもそれなりに変化しているだろう」と思った。
ここでは所感のまとめをざっくりと書いていく。

2年前と変わらない事

以下サービスについての問題は出題頻度の多さが変わらない。

  • ストリーミング処理系(高確率で出てくる)
    • Dataflow
    • Pub/Sub
    • Kafka(しれっと差し込まれる)
  • データパイプライン系
    • Cloud Composer(DAGも覚えておくと良さそう)
    • Cloud Function
    • Workflows
    • ローコード系
      • DataFusion
      • DataPrep
  • モニタリング系
    • Cloud Monitoring
    • Cloud Logging
  • DWH
    • BigQuery
  • DB系
    • CloudSQL
    • Spanner
    • Bigtable
  • ストレージ系
    • CloudStorage
    • Dataproc
  • 権限管理系
    • IAM

2年前から変わったこと(追加されてた事)

サービス自体というより、各サービスの機能周りを問うものがでてきていた。
(各機能に関しての知識の深堀りが求められている?)
当時受験した際に無かった機能、もしくは試験範囲ではなかったものがいくつかあった。
(受験タイミングの試験内容にも寄るとは思うので、ここは人によって体感に差があるかもしれない…)

【例】

  • Cloud Data Loss Prevention
    • 機密データの保護機能
  • コネクテッドシート
  • BigQuery
    • BigQuery LM
    • Analytics Hub
    • Dataform
  • CloudStorage
    • Autoクラス
    • ターボレプリケーション
  • LLM関連(前回よりは減ったが、差し込みで出てくる)
    • 過学習が発生した際の対応
  • 料金
    • BigQuery Editions(スロット課金)

2年ぶりに受験してみての感想やまとめ

  • 一度受けたことがある&仕事でもGoogle Cloudに関わる機会が増えたためか、当時よりサービスについての理解がしやすかった
    • とはいえ、あまり触れていないサービスについてはわからないことも多かった
  • 機械学習系の問題は以前より大分減っていた代わりに、データ領域の深堀り系の問題が増えていた
    • Data Engineerの試験なので、これが本来の形なのかなと…
    • なぜ昔は多かったのか
  • Google Cloudのサービスの違いや用途別のベスプラを学ぶ良い機会だと改めて感じた
  • ドキュメントやベスプラ要約にはNotebookMLが結構役に立った。便利

Discussion