Databricks認定生成AIエンジニアアソシエイト Certification
Databricks認定生成AIエンジニアアソシエイト Certification
前提
資格は、ツールやVendorサービスに対するある一定の理解と考えています。私は、機械学習、ディーブラーニング、Transformerモデルなどの基本原理がわかっていればあとは各ベンダーが持っているソリューションの違いを把握するためにVendor試験を活用するとして対策を行っています。そういう人間から見た私的コメントとして下記の内容を参照していただければ幸いです。試験対策を考えている方の少しでも時間節約、参考になれば幸いです。
トレーニングコース受講と試験対策の関係
大企業様ですとDataScientistに対してトレーニング費用を潤沢に用意するところも多いので、Trainer付きのコースでしっかり基礎から勉強する環境がある方は行えば自然この近辺の知識は十分着いていると思います。ただ本テストを受かるためにそれらが絶対必要なのか?は、単純合格がTargetならFreeレベルでも十分だと思います。そのFreeに入っていないCode関連の質問を別途補足しておけば、現在のテストレベルであれば十分なものが提出されている形です。(*これも普段LLM開発していれば、あまり障害ないと思われます)
対策
Databricks training free course
Generative AI Fundamentals - Japanese :
生成AIの開発をPythonでやっているような人にはほぼただの常識なのでほぼ、すっとぱしてOKです。ただここら辺の基本ラインがこのテストのレベルに近いかもしれません。DBXに触ったことがなければ後半のDatabricks AIあたり(*下記の画像)のみをみられるのが良いのではと思いますが、テスト出題内容としてはあまりそこら辺の細かい話は出ていない感触です。
Fine-tuning Embeddings and Advanced Reterival (EN) 4h
L1距離(マンハッタン距離)
L2距離(ユークリッド距離)
コサイン類似度=要はベクトル:角度の類似度
内積(スカラー積)=角度&長さの類似度
例としてこのトレーニングをあげましたが、これらは勉強素材としては大変有用で原理理解には良いレベルですが、この試験合格には必要ないレベルの例で上げさせていただきました。
Free course以外で勉強しておくべき場所?対策?
- Ragなどのユースケース、構成の仕方などの基本的な理解(*今回の試験では。Ragのユースケース実装の仕方で、どれが適当か?などの質問が多く見られたため)
- Langchainでの実装の場合のCode例。
- MLFlowを使っての実装Code例。
- LLMのEvaluationの代表的なメトリック
上記がフリーのコースではあまり触れられていないので、一度見た方がいいかもしれません。
Ragのユースケースでの正誤問題は、普段LLM開発をしている方には対策なしで問題ない感じでしたが、少し心配な方は、Udemyに英語ですが問題集がこの対策用にあるので、1800円程度(*2025年10月時点)ですがその程度の金額投資であればやっても良いかもしれません。
私的結論コメント
ー普段LLM開発行っている人は、全く対策せずに試験受けて受かるレベル
ー開発作業でLangchainやMLFlow使ったことない人はそこの部分は、一度Code例参照してテスト実装するレベルでOK
ーLLM開発を普段行っていない方は、DatabricksのFreeのFundamentalコース受講とUdemyの試験問題集行えば対策としては十分。
ー1−2週間、1日x2時間程度の時間やればおそらくかなり高得点で合格できる(*私は3日間x1−2時間程度、Udemyの問題集を買って3セットの1セット半やる時間しか取れませんでしたがとりあえず合格はしました💦)
Discussion