🐈

分散の不偏推定量はなぜ(n-1)で割るのか

2021/06/22に公開

なんで書いたか

もやっとさせたままいたけど、ある日突然謎が解けました。備忘録兼、\LaTeXの練習兼、同じく困った人の役に立てたら。

検索上位に出る長々としたPDFを読みたくない方、数式で知りたい人向けです。

結論

登場人物の役割がよく分かってなかった。
とくに、 標本平均と母平均が異なるもの という理解ができていないとたどりつけない。

登場人物の整理

  • 母平均 : \mu

  • 母分散 : \sigma^2

  • 標本平均 : \bar{X} = \frac{1}{n}\sum_{i=1}^{n}X_i

  • 標本分散 : s^2 = \frac{1}{n}\sum_{i=1}^{n}(X_i - \bar{X})^2

  • 母分散の不偏推定量 : \sigma^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i - \bar{X})^2

\begin{aligned} E\left[\sum_{i=1}^{n}(X_i - \bar{X})^2 \right] &= E\left[\sum_{i=1}^{n}(X_i - \mu)^2 - \sum_{i=1}^{n}(\bar{X} - \mu)^2 \right] \\ &= n\sigma^2 - n\frac{1}{n}\sigma^2 \\ &= (n-1)\sigma^2 \end{aligned}

左辺はns^2なので、

\sigma^2 = \frac{n}{n-1}s^2

となります。

考え方

平均からの偏差平方和を 母分散と平均の分散に切り分ける と、
平均の分散は中心極限定理から\frac{1}{n}\sigma^2になるので、結果として\sigma^2ひとつ分少なくなるというわけです。

最後に

間違いなどあれば指摘ください。

\LaTeX 初挑戦だけど綺麗にレタリングされるのとても気持ちよかったです。むだにいっぱい使ってしまった。マークダウンだと可読性低すぎて振り返れないですね。

GitHubで編集を提案

Discussion