🧸
AWS Certified Machine Learning(MLS-C01)受験記録
お前だれよ
- バックエンドとかETL書いてる
- AWSは今は使っていない。以前、RDSとかEC2とかはちょっと触った
- AWSの資格は3つ目
- 機械学習の知識
勉強したこと
色々書いてますが、
- まずはExam Readinessで概要
- AWS Certified Machine Learning SpecialtyでAIサービス系
- Data Science on AWSでSageMaker
- scikit-learn、Keras、TensorFlowによる実践機械学習で機械学習系の知識
を勉強しました。
Exam Readiness:AWS Certified Machine Learning - Specialty
AWS試験毎(多分)にあるAWS提供のやつ。
内容
- 試験形式・範囲の説明
-
試験ガイドにある4つの分野毎の説明
- データエンジニアリング
- 探究的データ分析
- モデリング
- ML 実装と運用
- サンプル試験
感想
- 日本語字幕あるのと、分量的に最初の取っ掛かりとしては、これが一番良さそう
AWS Certified Machine Learning Specialty 2021 - Hands On!
Udemyのコースです。
Database speciality版、Data Analytics版もあります。
内容
- 10時間のビデオ
- 4つの分野ごとの説明
- Data Enginering(1.5時間)
- データの挿入の部分の話
- サービスで言うと、Glue・S3・Kinesis family
- 機械学習概念の話ないので、Data Analyticsの経験あれば省略して良いかも
- Explaratory Data Analysis(2.5時間)
- データ入ってから、本格的に分析するまでの話
- サービスで言うと、QuickSight・EMR・Athenaあたり
- 分布、欠損値、外れ値、エンコーディングあたりのデータの扱いの話
- Modeling(4.5時間)
- 「機械学習」って言われた時に、(たぶん)一番イメージする部分の話
- DLの話(活性化関数、RNN、CNN、正則化)
- アルゴリズムの評価の話(Precisionとか混合行列)
- SageMaker組み込みアルゴリズムの話
- サービスで言うと、SageMaker、AIサービス群(Comprehend、Polly…)
- ML Implementation and Operations(1時間)
- 機械学習モデルをデプロイする時の話
- サービスで言うと、SageMaker(推論まわり)
- 10問程度のPracitce Examがありますが、模擬試験は別コースで提供されています
感想
- 講師の人の英語(Frank Kaneさん)の英語が聞きやすい
- 機械学習のアルゴリズム系は、このコースだけだと厳しいかも
- 逆に、AIサービス(Comprehend、Polly…)の概要を知るには良かった
Data Science on AWS
O'reillyの本です。日本語版もあります(自分が読んだ時は出版前だった)。
内容
- 名前の通りAWSでデータサイエンスするホンです
- 機械学習の入門(ユースケース、関連するAWS)
- AutoML
- データ挿入・探索的データ解析
- 前処理(Embeddingとかデータの分割)
- 学習(例としてBERT・AWSのレビューデータセットを使います)
- デプロイ
- モデルのデプロイそのもの話と、デプロイした後のモニタリングの話
- パイプライン
- サービスで言うと、SageMaker family(Studio/Notebook、AutoML、Training、Inference、Clarify、Experiment、FeatureStore、HyperParameter Tuning)とAthena・Glueあたりです
感想
- この試験受かるだけの話で言うと、全部やるのはオーバースペックかもしれません(特にFeatureStoreとかExperiment・Clarifyあたり)
- SageMakerは色々な機能・コンポーネントがあり、ややこしい・イメージが掴みにくいと思います。この本があると理解の助けになります
- workshopがGitHubに公開されています。実際動かしたら1万円程度でした(ちょっと停止・削除忘れもあったので本来もう少し安いかも)。
scikit-learn、Keras、TensorFlowによる実践機械学習 第2版
内容
- 名前の通り、scikit-learnを使った機械学習と、Keras・Tensorflowを使ったディープラーニングの本です
- 機械学習入門
- 非ディープラーニングの機械学習
- 線形回帰
- SVM
- 決定木(+ランダムフォレスト)
- 次元削減
- クラスタリング(k-means、混合ガウス)
- ディープラーニング
- ニューラルネットワーク・DL入門
- Tensorflowの使い方(APIや入出力)
- CNN・RNN
- GAN
- その他(強化学習・大規模環境)
感想
- 800ページ近くあり、読むの大変ですが、広いトピックを扱っているので、機械学習入門に良いと思います
- AWS特化の話(SageMakerとかAI系サービス)は無いので、そこは別の資料でカバーする必要があります
各サービスのドキュメント
AIサービス
試験に時々出てくる、AI Service、つまり、
- Comprehend
- Translate
- Transcribe
- Polly
- Lex
- Rekognition
- Textract
- DeepLens
- IoT GreenGrass
- Personalize
について、FAQとサンプル・Getting Startedを眺めました。
SageMaker
細かい部分も試験にでることがあるので、SageMakerに関してはAIサービスより少し詳しく、
- Developer Guide
- 特に推論関係の機能と、組み込みのアルゴリズム
- FAQ
- SDK
- Developing Machine Learning Applications
を見ました。
模擬試験(たち)
- 公式の模擬試験
-
AWS Certified Machine Learning Specialty Full Practice Exam
- AWS Certified Machine Learning Specialty 2021 - Hands On!に対応する試験
- AWS Certified Machine Learning Specialty: 3 PRACTICE EXAMS
その他
- データベース試験の方にも書いたのですが、試験の日本語訳が、解答に影響するレベルで間違っている問題がありました。英語も確認した方が良いと思います
Discussion