なゆゆ

 機械学習のA/Bテストについて新しいモデルと本番稼働している古いモデル間でA/Bテストをすることで、新しいモデルが実際のユーザーに対して有効な効果を発揮するか評価することが可能です。

機械学習モデルでA/Bテストを行う場合、新旧のモデルに対して別々にトラフィックをルーティングできるよう仕組みを作る必要がありますが、Amazon SageMakerの場合は組み込みの機能による支援を受けることができます。
https://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/model-ab-testing.html#model-ab-test-example

なゆゆ

 SageMakerでのA/Bテストの枠組み推論エンドポイントに新旧のProduction Variantを作成し、トラフィックをルーティングすることで実現できます。
※上記ガイドより引用
Production Variantはエンドポイントがモデルをホストする際にインスタンスサイズやモデルなどを定義するものです。endpoint設定でVariantを指定し、エンドポイントをデプロイすることができます。また、endpoint_from_production_variantsでVariantから直接エンドポイントを作成することもできます。

なゆゆ

 シングルモデルエンドポイントでのA/Bテストの例以下のガイドなどで紹介されています。
あらかじめ訓練しておいたモデルから異なるバリアントを作成し、endpoint_from_production_variantsで同じエンドポイントに異なるモデルをデプロイします。
https://sagemaker-examples.readthedocs.io/en/latest/sagemaker_endpoints/a_b_testing/a_b_testing.html
initial_weightを設定することで、バリアント間にルーティングされるトラフィックの比率をコントロールできることが記載されています。
また、invoke_endpointのTargetVariantで対象となるバリアント名を指定し、特定のバリアントを呼び出すこともできます。

なゆゆ

マルチモデルエンドポイントでのA/Bテスト

これについては情報がみつかりませんでした。シングルモデルエンドポイントと同じようにバリアントを複数作成し、A/Bテストを実施したいモデルのみ異なるモデルを紐づけてデプロイするものと思われます。

なゆゆ

 エンドポイントへのバリアントの追加・削除例えば、『Amazon SageMaker 推論 Part 3』にあるように、update_endpointを使うことで実行できます。
https://pages.awscloud.com/rs/112-TZM-766/images/AWS-Black-Belt_2022_Amazon-SageMaker-Inference-Part-3_1014_v1.pdf
https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/sagemaker/client/update_endpoint.html

なゆゆ

ちなみにML-DarkのシリーズはYoutube動画がとても工夫されており、かっこいいなーと思いました。（おしゃれな感じに仕上がっています）
https://www.youtube.com/watch?v=eapwYF7ARBk
PDFはたびたび拝見していますが、動画を未試聴の方はぜひみてみてください。

なゆゆ

なお、エンドユーザーに影響を与えないモデルのテストの枠組みとして、シャドウテストもサポートされています。

シャドウテスト向けにバリアントを登録すると、リクエストがコピーされてシャドウバリアントで処理できるようです。

このスクラップは6ヶ月前にクローズされました