🧸

AWS Certified Machine Learning(MLS-C01)受験記録

2021/10/31に公開

お前だれよ

勉強したこと

色々書いてますが、

を勉強しました。

Exam Readiness:AWS Certified Machine Learning - Specialty

AWS試験毎(多分)にあるAWS提供のやつ。

内容

  • 試験形式・範囲の説明
  • 試験ガイドにある4つの分野毎の説明
    • データエンジニアリング
    • 探究的データ分析
    • モデリング
    • ML 実装と運用
  • サンプル試験

感想

  • 日本語字幕あるのと、分量的に最初の取っ掛かりとしては、これが一番良さそう

AWS Certified Machine Learning Specialty 2021 - Hands On!

Udemyのコースです。
Database speciality版Data Analytics版もあります。

内容

  • 10時間のビデオ
  • 4つの分野ごとの説明
  • Data Enginering(1.5時間)
    • データの挿入の部分の話
    • サービスで言うと、Glue・S3・Kinesis family
    • 機械学習概念の話ないので、Data Analyticsの経験あれば省略して良いかも
  • Explaratory Data Analysis(2.5時間)
    • データ入ってから、本格的に分析するまでの話
    • サービスで言うと、QuickSight・EMR・Athenaあたり
    • 分布、欠損値、外れ値、エンコーディングあたりのデータの扱いの話
  • Modeling(4.5時間)
    • 「機械学習」って言われた時に、(たぶん)一番イメージする部分の話
    • DLの話(活性化関数、RNN、CNN、正則化)
    • アルゴリズムの評価の話(Precisionとか混合行列)
    • SageMaker組み込みアルゴリズムの話
    • サービスで言うと、SageMaker、AIサービス群(Comprehend、Polly…)
  • ML Implementation and Operations(1時間)
    • 機械学習モデルをデプロイする時の話
    • サービスで言うと、SageMaker(推論まわり)
  • 10問程度のPracitce Examがありますが、模擬試験は別コースで提供されています

感想

  • 講師の人の英語(Frank Kaneさん)の英語が聞きやすい
  • 機械学習のアルゴリズム系は、このコースだけだと厳しいかも
  • 逆に、AIサービス(Comprehend、Polly…)の概要を知るには良かった

Data Science on AWS

O'reillyの本です日本語版もあります(自分が読んだ時は出版前だった)。

内容

  • 名前の通りAWSでデータサイエンスするホンです
    • 機械学習の入門(ユースケース、関連するAWS)
    • AutoML
    • データ挿入・探索的データ解析
    • 前処理(Embeddingとかデータの分割)
    • 学習(例としてBERT・AWSのレビューデータセットを使います)
    • デプロイ
      • モデルのデプロイそのもの話と、デプロイした後のモニタリングの話
    • パイプライン
  • サービスで言うと、SageMaker family(Studio/Notebook、AutoML、Training、Inference、Clarify、Experiment、FeatureStore、HyperParameter Tuning)とAthena・Glueあたりです

感想

  • この試験受かるだけの話で言うと、全部やるのはオーバースペックかもしれません(特にFeatureStoreとかExperiment・Clarifyあたり)
  • SageMakerは色々な機能・コンポーネントがあり、ややこしい・イメージが掴みにくいと思います。この本があると理解の助けになります
  • workshopがGitHubに公開されています。実際動かしたら1万円程度でした(ちょっと停止・削除忘れもあったので本来もう少し安いかも)。

scikit-learn、Keras、TensorFlowによる実践機械学習 第2版

O'reillyの本です

内容

  • 名前の通り、scikit-learnを使った機械学習と、Keras・Tensorflowを使ったディープラーニングの本です
  • 機械学習入門
  • 非ディープラーニングの機械学習
    • 線形回帰
    • SVM
    • 決定木(+ランダムフォレスト)
    • 次元削減
    • クラスタリング(k-means、混合ガウス)
  • ディープラーニング
    • ニューラルネットワーク・DL入門
    • Tensorflowの使い方(APIや入出力)
    • CNN・RNN
    • GAN
  • その他(強化学習・大規模環境)

感想

  • 800ページ近くあり、読むの大変ですが、広いトピックを扱っているので、機械学習入門に良いと思います
  • AWS特化の話(SageMakerとかAI系サービス)は無いので、そこは別の資料でカバーする必要があります

各サービスのドキュメント

AIサービス

試験に時々出てくる、AI Service、つまり、

  • Comprehend
  • Translate
  • Transcribe
  • Polly
  • Lex
  • Rekognition
  • Textract
  • DeepLens
  • IoT GreenGrass
  • Personalize

について、FAQとサンプル・Getting Startedを眺めました。

SageMaker

細かい部分も試験にでることがあるので、SageMakerに関してはAIサービスより少し詳しく、

を見ました。

模擬試験(たち)

その他

Discussion