🤖
A/Bテスト前に行うオフラインテストは、doubly robust よりシンプルな手法で十分なのではという提案
A/Bテスト投入前にはオフラインテストをする
Netflixなどの企業では、レコメンドエンジンなどのA/Bテスト前にオフラインテストにより実際に顧客に試す前にコンバージョンレートなどの点で効果がある施作なのかどうかを判断するということが行われている。
現状のオフラインテストの手法
大きく分けて2つの手法がある。
一つは古典的な offline replay という手法で、ランダムな要素をユーザーに提示して、そこで実際に発生した遷移を正解データとして用いる手法である。Netflix などが採用しているようだ。
この手法の欠点はランダムな要素をユーザーに提示する際、ユーザーの満足度が低下する点である。
もう一つは、これを改良した doubly robust estimators などの新しい手法である。ただ、実装するのが面倒という欠点がある。
もっとシンプルなオフラインテストで十分なのではという提案
結局、offline replay で実現したいのは既存のモデルのバイアスがない(そしてバリアンスの低い)遷移データなのだから、ページ遷移を
まとめ
- A/Bテストをいきなりやっている場合は、オフラインテストをしよう
- オフラインテストの方法は、遷移を一つ飛ばしでデータをとることで十分なのではないか?
Discussion