📚

AWS認定 AI Practitioner Beta と Machine Learning Engineer Beta を受験しました

2024/08/27に公開

2024/08/27、AWS 認定に AI/ML 系の新しいベータ試験「AI Practitioner (AI1-C01)」と「Machine Learning Engineer - Associate (ME1-C01)」がリリースされました!

で、さっそく受験してきました!
出題内容については書けませんが、受験に向けてやったことと受験後の感想を備忘録として残しておきます。

受験時のスキル状況

受験時の私の知識やスキル状況です。

  • 上位認定と思われる Machine Learning - Specialty を含む AWS 認定 13 個取得済です(2024 年 8 月 27 日時点、DAE や廃止分も含む)
  • 所属会社で AWS を使ったサービスの構築、運用保守業務に従事してます
  • Web3 層アーキテクチャに関連する AWS サービスはちょっとわかる
  • 一方で AI/ML 系の AWS サービス(Bedrock, SageMaker など)は業務で使用したことがなく、プライベートでも Bedrock ナレッジベースは試したことあるけど SageMaker までは触ってない、ぐらいの感じです

学習期間

学習期間は両試験合わせて 2 週間(1-2 時間/日)ぐらいです。

受験に向けてやったこと

試験ガイドと公式無料模擬試験

最初に試験ガイドで出題内容の確認をしました。

AI Practitioner 試験ガイド

Machine Learning Engineer - Associate 試験ガイド

次に Skill Builder にある無料の模擬試験を解いてみて、知識の現在位置を確認しました。

Exam Prep Official Practice QuestionSet AWS Certified AI Practitioner AIF-C01 English

Official Practice QuestionSet AWS Certified Machine Learning Engineer - Associate MLA-C01 English

AI Practitioner(AIF)は 20 問中 18 問正解でまずまずですが、
Machine Learning Engineer(MLA) は 20 問中 10 問正解で知識不足感あり。
AIF は何とかなりそうだったので、MLA に注力することにしました。

Bedrock 本

Amazon Bedrock をハンズオン形式で学べる人気の書籍です。
受験に向けてやったというよりは、もともと興味があって受験を決める前から購入して少しずつ読み進めていたという感じです。
この本のおかげで Bedrock に関する様々なキーワードがスッと入ってくるようになりました。
受験を決めてからも Bedrock でわからないところがあったときに辞書的に参照していました。

試験準備コース

Enhanced Exam Prep Plan AWS Machine Learning Associate MLA-C01

Skill Builder にある MLA の試験準備コースを受講しました。
こちらは無料ではなく有料サブスクリプション購入で閲覧できる方になります。

あまり触っていない SageMaker 周りが特に不安だったため、Skill Builder にお金を払い、このコースの中にあるラボ(ハンズオン)を一通りやりました。
手順が端折られちゃってる部分が結構あるのですが、それでもデータの前処理や特徴エンジニアリングで Data Wrangler を触ったり、Notebook でモデルをトレーニングしたりできます。
機械学習で SageMaker を使うときに何を考えなければならないのか、実際の操作から学ぶことができました。

公式模擬問題 (有料)

Official Pretest: AWS Certified AI Practitioner (AIF-C01 - English)

Official Pretest: AWS Certified Machine Learning Engineer - Associate (MLA-C01 - English)

最後に模擬問題にチャレンジしました。
こちらも Skill Builder のサブスクリプションを購入することで閲覧できる有料のコンテンツになります。
無料の模擬試験と比べて問題数が 65 問と本番相当になっています。(ベータ試験では 85 問ですが)

模擬問題を解いてみて、キーワードや正解/不正解の理由などわからない点があれば調べてまとめました。
特に以下の点は重点的に調べて頭の中を整理しました。

  • モデル開発のステップ(データ収集、前処理、特徴量エンジニアリング、トレーニング、評価、デプロイ、モニタリング)
    • 各ステップで頻出する機械学習のキーワードと意味
      • データ収集: データソース、データレイク、ETL (Extract, Transform, Load)
      • 前処理: データクレンジング、正規化、標準化、欠損値処理
      • 特徴量エンジニアリング: 次元削減、主成分分析 (PCA)、特徴量選択
      • トレーニング: ハイパーパラメータ最適化、交差検証、過学習と過少学習
      • 評価: 混同行列、精度、再現率、F1 スコア、ROC 曲線、AUC、バイアス
      • デプロイ: A/B テスト、カナリアデプロイメント、ブルー/グリーンデプロイメント
      • モニタリング: コンセプトドリフト、データドリフト、モデルパフォーマンス追跡
    • それぞれのステップに該当する SageMaker の機能はどれなのか、どのように使うのか
      • 全体管理・オーケストレーション: SageMaker Studio, SageMaker Pipeline
      • データ収集: Amazon S3 (データストレージ), AWS Glue (ETL ジョブ)
      • 前処理: SageMaker Data Wrangler (データ準備と可視化)
      • 特徴量エンジニアリング: SageMaker Data Wrangler (データ準備と可視化), SageMaker Feature Store (特徴量の管理と共有)
      • トレーニング: SageMaker Training (モデルトレーニング), SageMaker Automatic Model Tuning (ハイパーパラメータ最適化), SageMaker JumpStart(事前トレーニング済みモデル利用)
      • 評価: SageMaker Clarify (モデル説明可能性と公平性評価), SageMaker Debugger(モデルパフォーマンスのデバッグ・改善)
      • デプロイ: SageMaker Endpoints (リアルタイム, 非同期, バッチ)
      • モニタリング: SageMaker Model Monitor (モデルのドリフト検出, データ品質モニタリング)
      • 自動化・ノーコード・ローコード: SageMaker Autopilot, SageMaker Canvas
      • 監査・共有: SageMaker Model Registry, SageMaker Model Cards
  • モデル
    • 各モデルがどういう用途でつかわれるのか
      • 線形回帰: 連続的な値の予測 (例: 住宅価格予測)
      • ロジスティック回帰: 二値分類問題
      • ランダムカットフォレスト: 異常検出
      • XGBoost: アンサンブル学習、回帰・分類
      • 潜在的ディリクレ: トピック
      • 因数分解器: レコメンド
      • (省略)
  • Bedrock, SageMaker 以外の ML 系サービス(Comprehend, Rekognition, Textract, Transcribe など)
    • それぞれで何ができるのか
      • Amazon Comprehend: 自然言語処理 (感情分析、エンティティ抽出、キーフレーズ抽出、PII 識別)
      • Amazon Rekognition: 画像・動画分析 (物体検出、顔認識、コンテンツモデレーション)
      • Amazon Textract: ドキュメントからのテキスト抽出
      • Amazon Transcribe: 音声のテキスト変換
      • Amazon Translate: 翻訳
      • Amazon Personalize: パーソナライズされたレコメンデーション
      • Amazon Forecast: 時系列データの予測
      • Amazon Lex: チャットボットと対話型インターフェースの構築
  • 前提条件がついたとき(機械学習に関する知識がない、最も安いなど)どのサービスを選ぶか

不明点をまとめながら 3 周程度模擬問題を解いて、本番試験にのぞみました。

受験結果と感想

スコアは AIF が 751 点、MLA は 758 点でした。
点数は高くないですが無事合格することができました。

AIF は Foundational レベルではありますが、普段 AI/ML の技術に触れない方にとっては難しめだと思います。
それゆえに、AI/ML 系のトピックを体系的に学習できるとてもよい試験だと思います。
AWS の知識だけでなく機械学習分野の知識もある程度必要になりますので、G 検定の試験対策本なども有効だと感じました。

MLA は AIF と比較して AWS のサービス、特に Bedrock や SageMaker, Glue, Redshift, EMR, およびそれらを制御する IAM などに関して、より深い知識と経験が必要になる印象でした。

両試験を通じて、AI/ML の理論的な基礎から実践的な AWS 上での実装まで、幅広い知識を獲得できました。
今現在 AWS の AI/ML 系サービスを触られている方に限らず、これから学んでいこうとされている方にもおすすめできる認定だと思います。

Discussion