databricksの資格全部とってみた(かった)
はじめに
本記事はDatabricks アドベントカレンダー2024 16日目の記事です。
databricksの資格を全部とってみた!
...かったんですが、年末のあれやこれやであと2つほど残ってます...。
中途半端な感じですが、勉強方法や各資格について紹介したいと思います。
(あれやこれやが終わったら、残りの資格もとって記事を更新したいと思います。)
勉強方法
databricks academy
各資格の推奨コースがあるので、これを使うのが正攻法かなという気がします。一部有料のものがあるので無料のものだけを利用しました。かつ動画を全て観るのは時間が掛かり過ぎるので、デモのnotebookの内容を確認するに留めました。
RAGで自作学習コンテンツ作成
各資格のexam guideの中で出題範囲が箇条書きで記載されています。
この各項目に対して、RAGでdatabricksのドキュメントの内容引っ張りつつ、解説させることで自作の学習コンテンツを作成しました。
databricksのドキュメントからベクトルDB作る辺りの実装は下記を参考にさせていただきました。
udemyの演習問題
やはり資格対策は演習問題が一番効く、ということでudemyの演習問題を解きました。試験によって若干クオリティにバラツキはあるんですが、必要に応じて公式のドキュメントを参照しながら進めることで、効率的に資格対策を行うことができました。
各資格詳細
Data Engineer Associate (11/4合格)
databricksの資格といえばまずはこれ、という感じ。academyのコンテンツとudemyの問題で対応。最初の試験だったのでちゃんと準備しましたが、日本語ということもあり、比較的easyな印象でした。
Genrerative AI Engineer Associate (11/7合格)
最近できた生成AI系の資格です。RAGのdatabricksでの実装とか触っておけると良さそうです。DAISの発表でこの資格について解説しているものがyoutubeに挙がっているので、こちらも参考になるかと思います。
databricksに限定しない、生成AI活用についても良問が多く、楽しかったです。こちらも日本語ということと、最近手を動かして触れている分野でもあったので苦戦はしませんでした。Data Analyst Associate (11/9合格)
ここからは英語試験となるので、難易度5割増しです。
SQLやDashboardに関する問題が出題されます。普段あまりSQLを使わないので、cube,roll upといった少し込み入った内容を改めて学ぶ必要がありました。dashboardのスケジュールに関する細かい問題も出たりします。webで検索すると、結構容易な試験と言われていることが多いのですが、個人的には結構難しく感じました。
下記の記事が試験範囲を詳細解説してくれていて助かりました。
Machine Learning Associate (11/24合格)
結構、機械学習の知識に関する問題が出ました。シナリオに適したメトリクスを選ぶ問題など。mlflow、automl、sparkmlなどコードレベルで理解が必要なため、十分に対策する必要があります。
Machine Learning Professional (12/1合格)
Professionalというだけあって、難しかったです。59問出題され、問題文も長いので単純に疲れます。model registory周りがレガシーな内容だったり、個人的にほとんど使っていないwebhookやapiの問題が結構出て、ダメかと思いました(実際得点はかなりギリギリだった)。
おわりに
資格対策の中で知らないこと・機能を知ることができて良い勉強となりました。期せずして英語文の多読のトレーニングにもなりました。
あと2つの資格も今年中には取りたいなと思っています。
Discussion