🍊

Google CloudのProfessional Data Engineer認定試験受かったので受験記を残す

2024/03/10に公開

はじめに

こんにちは,いま楽天という会社でApplications Engineer(Data Engineer)として働いています。社内におけるTableau活用推進とWorkbook作成支援を仕事でやっているので,前回の記事では,Data Saberを取ったころの話をしていました(ご興味ある方は師匠拝命いたしますので気軽にTwitterへDM投げてください)。

一方で,そのTableauから接続するデータソースが最新のデータを保持するように,データパイプラインを更新・メンテナンスするという業務も担当しています。

今回その勉強も兼ねて,Google Cloud Professional Data Engineerという認定試験に挑戦して,なんとか合格したので,受験記として情報を残しておくことにしました。よろしくお願いいたします。

(2024/03/16追記)マンガでわかるGoogle Cloudという資料を思い出したので追記。

結局まとめると

  • やったのは,公式ドキュメントや講義資料,想定問題の2つ。少し長めに4,5ヶ月くらいかけたけど短くできるかも
  • 正しい答えが決めきれない問題がある&解説が異なることがあるので,想定問題は複数のリソースを参照する
  • 基本初見の問題ばかりなので,試験のときに慌てない
  • 勉強を通して,Apache系技術やファイル形式など,Google Cloud以外の技術知識も得ることができたので良かった(感想)

やったこと,かけた時間

いろいろ手は出したんですが,結局は「1. 公式ドキュメントや講義資料」「2. 想定問題(複数種類)」を繰り返し履修しました。ある程度1.で下知識をつけつつ,2.で頭を違う使い方で鍛えて知識を整理して,1.に戻る,でまた2.をやってみる,…みたいな。

ここで気をつけたいのは,「想定問題の本当に正しい解答は決めかねる」という点です。現実に直面する状況を想定してか,PDE試験では「この問題文ならどっちの選択肢も不正解にできんやろ」という問題が結構あります。そのため,想定問題は複数の書籍やソースを見たほうがいいです。それらから,自分なりの正解の決め方を形成していく,という作業をやると,チカラがつきます。

以下,具体的に羅列しておきます。

  1. 公式ドキュメントや講義資料。結局全部はやれていませんが,最新の,かつ,ちゃんと体系的な知識はここで充分だと思います。「最新の」と書いたのは,後述の想定問題で取り扱われている技術がいくつかDecomission(廃止)されて別のサービスに統合されていたりするためです。

    1. Preparing for Google Cloud Certification: Cloud Data Engineer Professional Certificate | Coursera

      他の方の受験記に,一週間の無料期間で対象コース7つ見ましたって書かれていたので普通の三連休にやったら全然終わらなくて最初の4コースしか出来ませんでした照 後者と内容としては変わらないのと,包括的で量が多く,Professional Data Engineer試験に何が必要なのか分かりにくいのが難点という印象。これ見るなら後者ひとつでいい気がします。

    2. Google Cloud Skills Boost Data Engineer Learning Path

      公式なだけあって量がとても豊富。Professional Data Engineerだけでなく他の認定試験についての講座もあるので,やはり時間使うならこれかなって思います。

      あとこれは余談ですが,自分は元々別業界から来てクラウド技術やデータ技術を主務でやっていたわけではなかったので,Professional Data Engineer認定試験の前にAssociate Cloud Engineer認定試験を受けるのが先だったなと思います。認定試験の一覧はこちらをご確認ください。

  2. 想定問題。問題を解いて,間違えた問題をメモ帳にまとめて,通勤時に見たり直前に振り返ったりしました。Udemyと徹底対策は2周ずつしました。Examtopicsはそこに出ていた問題の裏付けとしてたまに参照しました。

    1. 【最短攻略】Google Cloud 認定 Professional Data Engineer 模擬問題集 | Udemy

      50問×3セットの試験想定で受けることができる。タイマーや振り返りたい問題にチェックマークをつけられるので,本番の形式に近いかたちで練習ができるのでおすすめです。ただし,他文献と解説が異なることがたまに見受けられる(どちらが正しいかは意見が分かれるが故)ので,他文献と合わせて参照することをおすすめします。

    2. 最短攻略 Google Cloud 認定資格 Professional Data Engineer 模擬問題集: 50問 × 3セット +40問 190問 クラウド試験徹底対策シリーズ最短攻略編

      Udemyの150問以外に問題ないかなあと思ってAmazonをみていたら見つけました。Udemyとほぼ一緒の問題もありつつ,Udemyにはない問題もできたので,これを選んで正解でした。

    3. Examtopics

      上ふたつを解いている最中で,明らかに日本語としておかしいタイポや適切としている選択肢のずれを見つけました。これについて,英語原文はどうなっているんだろうと思ってGoogle検索しているときに見つけました。投票形式になっていて,英語圏でも正答とする選択肢が割れていることを知ったり,コメントからGoogleの公式技術ブログを参照してなるほどと膝を打ったり,このサイトはもう少し早く見つけたかったですね。とどのつまり,何を正解とするかは人によって意見が分かれるということを自信を持って認識できて,不安を拭うことが大事です。

  3. 書籍

    1. 実践的データ基盤への処方箋 〜ビジネス価値創出のためのデータ・システム・ヒトのノウハウ https://gihyo.jp/book/2021/978-4-297-12445-8

      試験と関係なく読んでいましたが,第2章で議論される「データ基盤システムのつくり方」にて,ファイル形式の違いに関する説明が理解を助けてくれました。同様の技術に関する書籍でもその後押しはしてくれそうなので,補助教材として1,2冊手を出しておくのはありです。

    2. マンガでわかるGoogle Cloudシリーズ

      Google Cloud公式が出してくれている資料です。シンプルに分かりやすいのですがいかんせん量が少ないのが悲しい。サービスごとに解説してくれたらめちゃ助かったのにな,と思っています。ここでは2023年に公開されたアプリケーション基盤編と,2022年に公開されたCloud Spanner編を紹介します。これらの他にあったら教えて下さい。

      https://japan.zdnet.com/paper/30001001/30006864/

      https://inthecloud.withgoogle.com/app-manga-ebook-jp-23/dl-cd.html

こうしておけば良かったなということ

認定試験ガイドを総ざらいするように自分の勉強が足りないところを意識しておけばよかったな,とは試験が終わって思いました。

以下が公式の試験範囲なのですが,自分の場合,「3.4 データメッシュを考慮した設計」とか「Google Cloud への移行計画(BigQuery Data Transfer Service、Database Migration Service、Transfer Appliance、Google Cloud ネットワーキング、Datastream など)」とかをもう少し理解しておけばよかったなぁって試験中に思いました。(なんで試験範囲確認してないんですか?)

Professional Data Engineer 認定試験ガイド  |  Learn  |  Google Cloud

おわりに

久しぶりに試験のようなものを受けて脳が疲れました。合格したから言えることかもしれないんですが,こういうクイズ形式で自分の知識がアップデートできるのは良かったなと思います。とくに,もともとData Engineerではなかったので,kafkaとかApache SparkとかAvroとか,基本的な前提知識がなかったので,それらも合わせて理解できたのは,間違いなくこの試験勉強のおかげだと思っています。

ただ,受験費用が高めなので,合格できる確信をもう少し持って受験に挑みたかったです。Googleさんもう少し問題を実戦形式で練習できる環境がほしいです,よろしくお願いいたします。

Discussion