🦔
AWS Machine Learning Engineer Associate試験勉強（インフラ編）

2024/10/21に公開
 この記事は？AWS Machine Learning Engineer Associateの試験を受けることになったので、模擬問題に出ていたインフラをまとめました。AWSのインフラが絡まない機械学習の話題はこの記事には出てきません。試験までの間項目を随時追加していく予定です。
Machine Learning Specialityと内容的には重複する部分も多いので、以下の記事も参考にしてください。

https://zenn.dev/simossyi/articles/6ef7c2df447e20

 本文
 SageMaker関連
SageMaker Canvas
ノーコードで機械学習ができるサービス
回帰、分類、時系列予測、自然言語処理、コンピュータービジョンモデルを構築できる（Autopilot）
LLM（Bedrock）を呼び出したり、finetune、デプロイができる


SageMaker Clarify
データセットのバイアス（偏り）やモデル出力のバイアスをレポートできる
モデル出力のバイアスに関しては以下のレポートが利用できる。いずれも特徴量が予測にどのくらい貢献するかを定量化する手法
Partial Dependence Plot（PDP）
SHapley Additive exPlanations（SHAP）



SageMaker Data Wrangler
ノーコードでデータの分析、前処理と特徴量エンジニアリングを行える
特徴ごとのヒストグラムや散布図、平均分散などの統計情報を出力できる
テーブルデータに対する操作（列の削除、欠損値補完等）が実行できる

S3やAthenaなどのAWSリソースやサードパーティのソースにアクセスできる
SageMaker Studioからの利用が前提


SageMaker Endpoint
エンドポイントの種類が複数選択できる
リアルタイム推論：リアルタイムでの要件に適する。サーバーは立ちっぱなしになるため最もコストがかかる
サーバーレス推論：ニアリアルタイムでの要件に適する。初回呼び出し時にはコンテナを立ち上げる時間がかかるが、一度コンテナが立ち上がればリアルタイムに近いレイテンシになる。呼び出した時にのみ課金されるためコストを抑えられる。サーバーレスであるためインスタンスは選べない。GPUも選択不可。エンドポイントの動作時間は60秒、メモリにも制約があり、最小で1GB、最大で6GB
非同期推論：ニアリアルタイムでの要件に適する。動作していない時はサーバーを立ち上げないためコストを抑えられる。推論のデータはS3上に配備する必要がある。エンドポイントの動作時間は1時間、最大1GBの入力を処理できる



SageMaker Feature Store
機械学習の入力となる特徴量を一元管理できるサービス


SageMaker JumpStart
基盤モデル含む事前学習済みモデルをノーコードで組み込める。Pytorch hubやHuggingFaceのモデルを利用できる
SageMaker Studioの機能の一つ
エンドポイントが立っているだけで課金が発生する。サーバーレスに実行したい場合はBedrockを使うべき


SageMaker Model Monitor
デプロイ後(本番環境/エンドポイント)のモデルの予測品質をモニタリングする
作成済みのエンドポイントに対して設定するため、学習時に使うものではない

リアルタイム推論とバッチ処理のエンドポイントに対して設定できる
学習時(ベースライン)と比べて推論データの統計情報が異なっていること（データドリフト）を検知できる
推論時のパフォーマンスも計測できる。ただし、正解ラベルの登録を随時要求される


SageMaker Model Registry
本番稼働モデルのカタログ化、バージョン管理、メタ情報の関連つけ、承認ステータスの管理、本番環境へのモデルデプロイ、他のユーザーとモデルを共有することができる


SageMaker Pipelines
データ前処理、学習、評価、デプロイといった機械学習のワークフローを管理できる。step functionsの機械学習版


SageMaker Processing
フルマネージドなデータ前処理サービス


 その他
Bedrock
基盤モデル（FM）をサーバーレスに呼び出せるサービス
一部モデルに関しては追加事前学習やfinetuneが可能


Bedrock knowledge bases
RAGを実現するためのデータ管理サービス
マルチターンの会話を実現するセッション管理機能を搭載している


Amazon Fraud Detector
フルマネージドなオンライン不正検知サービス。複数の不正検知ができる
決済が不正か判定
新規アカウントが不正アカウントか判定
トライアルやロイヤリティプログラムの不正利用検知
アカウント乗っ取り検知



Amazon Kendra
マネージドな検索サービス。自然言語で検索できる
コネクタを介して接続したリソース（S3やslackなどを選択可能）上のオブジェクトを検索できる


AWS Lake Formation
データレイクを構成するためのサービス
Glueとの違いはデータへのアクセス管理を行うことだが、内部的にはGlueを使っている？ためかGlueにできないことはできないようである


Amazon QuickSight
BI分析を行うためのサービス
LLMが組み込まれており、自然言語で分析クエリを渡せる


Amazon Redshift
データウェアハウス向けのサービス
分析readyな綺麗なデータを格納するために使う。読み込みをメインの用途としているデータベースとして運用する感じか
この記事は？

本文

SageMaker関連

その他

Discussion