MAU・DAU・ヘビーユーザ数の関係性を考察してみた
問題設定
あるサービスの月間のユーザ数(= MAU)を
このサービスを月間20日以上利用しているユーザ数(= ヘビーユーザ数)は?
という問題を考察したのでメモ。
考察
MAU に含まれるユーザで1ヶ月(30日としておく)のうち
求めたいのは
DAU に含まれるユーザで1ヶ月のうち
よって DAU は
と表せて、ここから1ユーザあたりの利用日数の期待値が
となることがわかる(ただし
これ割と非自明な結果だと思ったんですが自明ですかね🤔
(例えば DAU と MAU の比率が 1:4 だったら1ユーザが1ヶ月に利用する期間の期待値が1週間ということ)
というわけで、 DAU と MAU の値からは分布の期待値しか決まらないことがわかったので、ヘビーユーザの数を推定するには分布を仮定する必要がある。
簡単のために指数分布
指数分布の期待値は
20日以上利用しているユーザ数は
となった。
検証
さて、当社サービス(A~G)の過去30日の
サービス | R | H |
---|---|---|
A | 0.5615171138 | 0.559666975 |
B | 0.4487651549 | 0.3297709924 |
C | 0.284519828 | 0.1698518872 |
D | 0.2378303199 | 0.09469170144 |
E | 0.2018749334 | 0.07414509428 |
F | 0.1734296832 | 0.08282379099 |
G | 0.08352623457 | 0.01080246914 |
ログイン日数を指数分布で仮定した場合は
そもそも MAU に占めるヘビーユーザの割合が高い場合は指数分布の仮定が適切ではないので、
これを見るとサービス F は
実際ログイン日数の分布を見ても
そもそも指数分布はポアソン過程(あるイベントが一定確率で発生する)から導かれる分布だから、指数分布に近いということは「何かそれが必要なイベントが一定確率で発生して利用する」サービスだということになる。サービス E や G は確かにそういう性質のサービスだなあという感想だし、 F はちょっと系統が違うサービスではあった。
Discussion