📝

問題を解きながら取得するProfessional Data Engineer

2021/12/10に公開

この記事はIT資格取得をテーマに学びをシェアしよう!【PR】Udemy Advent Calendar 202110日目の記事です!

つい先日Professional Data Engineerを取得したので、どのように勉強することで合格に至ったかを残しておこうと思います

これを参考にして社内でProfessional Data Engineer(以下PDE)を受ける人が増えるといいなと思っています

https://twitter.com/tenajima/status/1466624894943522821?s=20

想定読者

  • PDE取りたいんだ!という思いを持っている人
  • GCPのサービスをたくさん使ったことあるわけではない人
  • 実際にPDEの問題をたくさん解きながら対策したいよーという人


問題をたくさん解きたいよー(cv. 野田クリスタル)

PDEとは

  • Googleの認定資格です
  • 「Professional Data Engineer は、データを収集、変換、公開することで、データに基づく意思決定を支援します」とのことです
  • 評価される能力は
    • データ処理システムの設計
    • ソリューションの品質の確保
    • 機械学習モデルの運用化
    • データ処理システムの構築と運用化

詳しくはこちら!
https://cloud.google.com/certification/data-engineer

どんなことしてる人

普段僕がどんなことをしてるかは、GCPの知識がもともとどれくらいあったかを知ってもらえるかなと思いますので

  • 元々はアナリストとデータサイエンティストとエンジニアを足して3で割ったような存在です
  • 普段はBIツール(Looker)を使いながらデータアナリスト以外もデータ分析ができるように考えてます
    • ここではBQをゴリッゴリに使ってます
    • SQLとはマブダチです
  • プロダクトの効果計測を行うために、どういうログを仕込もうか設計しています
    • 僕自身実装はしておらず、プロダクト側でログを吐いてもらい、そのログを拾ってBQに入れるイメージです
    • BQにはどのように入ってると嬉しいかをデータエンジニアの方と話しながら進めています
  • 分析でゴリゴリPythonを書くこともあります
    • 作業はGCE上にjupyterを立てて作業しています
    • 最近はあまり参加していないですが、kaggleやatma cupに積極的に参加していたのでAI周りはそれなりに知識があります
  • プロダクトで機械学習が要なときはAI Platformで作成しました

勉強を始めるまでに自信があったのは

  • AI
  • BQ

以上!ほんとこれだけで、不安でした

Dataproc...Spanner...何を言ってるのか?さっぱり...!

学習期間

  • 学習期間は3ヶ月でした
  • 9月から11月まではまるまる学習できて、試験は12月2日に受けました
  • 試験日は自分の都合の良い日を選べるので、基本情報などと比べて調整しやすいです

使った教材

coursera

couseraメインに進めました
このカリキュラムの6つのコースを進めました
courseraの中でQwiklabsによるハンズオンもあるので手を動かして覚えたい方も安心できるかと思います
動画学習は通勤時間に行えるので学習しやすく、習慣化もしやすかったです

https://www.coursera.org/professional-certificates/gcp-data-engineering-jp

公式本

この本がおすすめです
英語しかないのですが、買ってよかったと思っています
何が良かったかは後述いたします
https://www.amazon.co.jp/gp/product/B086Q6V6G6/ref=ppx_yo_dt_b_d_asin_title_o07?ie=UTF8&psc=1

学習の道のり

  • courseraの1コースごとに10時間近くかかるので、月に2コース行い3ヶ月で終える計算で進めました
    • この辺りは自分が知っている分野だったら飛ばし見していました
    • 僕の場合BQやAIあたりはちゃっちゃと飛ばし見して、pub/subやETLなどを厚く見るなどしていました
  • 11月の中旬くらいでcourseraは一通り終え、PDEの模試も受けたのですが、これだけだと不安だったので、上記公式本を購入しました
    • PDEの模試と実際の試験を比べると、実際の試験の方が難しいです
    • ただ、公式本の問題は実際の試験に近く感じました

学習のコツ

courseraとの付き合い方

  • 振り返ると、もっとさっさと進めてもよかったなと思っています
  • PDEに関わる技術を一通り頭に入れる目的、一通り触るぞという目的でさーっと見たら良いかなと思います
  • 模擬試験を受けていくなかで振り返りたくなったら再度戻ってくるのがよかったなと反省しています

公式本との付き合い方

  • 僕自身英語が堪能ではないので、読んでいく中でサービスが出てきたら、そのサービスのコンセプトをググって読んでいました
    • pub/subってのが出てきたら「pub/sub concepts」ってググって出てきたdocsを読んでいました
      • この内容は公式本でも似たようなことが書いてあったので有用だったなと思っています
    • docsを読んだら、本の各章に「Exam Essentials」という項目があるのでそこはしっかり読んで、各章の「Review Questions」で実際に問題を解いていました
    • 問題を解いていくと「Hadoopがきたらdataprocのことだなー」とかパターンが見えてくるので問題をたくさん解くことはやってよかったと思っています
    • 問題を解く上で、英語に頭のリソースを割いてしまうのが煩わしかったので、問題と答えを和訳して、Notionで答えると点数が出るようにしていました
    • このようにすることで空き時間にサクッと問題を解くことができてよかったです

問題はNotionで管理していました
問題はNotionで管理していました

まとめ

  • Googleの試験は最終的に正答率がどれくれいだったかなどは出ないのでどれくらい解けたのか分かりませんが、2時間の試験のうち1時間で解き終わり、1時間は見直しをしていました
  • GCPのデータ周りのサービスを体系的に学ぶために、PDEはすごくいい選択肢だなと思います
  • 今年弊社(Unipos株式会社)では6名のGoogle認定資格に合格したのですが、ベースとなる理解が揃っていくのはとても尊いなと思います
    • PDEはまだ僕だけなので、後に続いてくれそうな人を全力で応援したいと思います
  • この記事がPDEを受ける人にとって、少しでも役に立ってくれれば幸いです


っしゃ!PDE受かった!っしゃ!

Discussion