最尤、MAP、ベイズ推定についてわかりやすく簡単にまとめた
事前知識
以下の記事で、同時分布からベイズの定理までを解説しているので、ぜひ読んでみてください。
最尤推定
概要
最尤推定では、
-
を尤度と呼び、P(X_1...X_N|\theta) というパラメータに対する確率分布とデータの類似度を示します。\theta -
のように、最尤推定では、データに最も合うようにパラメータを調整します。\argmax_{\theta} P(X_1...X_N|\theta)
つまり最尤推定とは、
例えば、表の出る確率が不明なコインを10回振って5回表が出れば、最尤推定では表と裏の出る確率両方とも50%と推定できます。10回中8回表が出れば表の出る確率が80%、裏の出る確率が20%と推定されます。
最尤推定の問題点
しかし最尤推定には問題があります。それは、最尤推定はデータのみに頼った推定を行うところにあります。データ
たとえば、コインを10回投げて10回表が出れば、このコインは絶対に表が出ると推定されます。よって最尤推定は問題があることがわかります。
MAP推定
概要
MAP推定は、ベイズの定理を用いて、事後確率が最大となるパラメータを求める方法です。事前確率と尤度を掛け合わせて最大値を求めます。
-
を尤度と呼び、P(X_1...X_N|\theta) というパラメータに対する確率分布とデータの類似度を示します。\theta -
を事前分布と呼び、あらかじめP(\theta) はこんな分布に似てそうだなと予測した分布のことです。X_1...X_N
特徴
- MAP推定は、事前確率を用いるため、極端なデータの偏りに対して補正ができます
- たとえば、サイコロを3回投げて3回「1」が出たとしても、事前確率から「1/6」が標準的な値と見なすことができるため、極端な結果を避けられます。
ベイズ推定
概要
ベイズ推定は、データに最も近い1つのパラメータを求めるのではなく、全てのパラメータの範囲での分布を求める方法です。
ベイズ推定では、すべてのパラメータの分布を計算します。
3つの推定法の予測密度分布について
予測密度分布とは、未知の新たなデータ
最尤推定とMAP推定
最尤推定とMAP推定では、データ
ベイズ推定
ベイズ推定の場合、
また、
つまり、最尤推定とMAP推定はベイズ推定の派生と考えることができます。
Discussion