中心極限定理(CLT)の完全証明その1: 直感的説明
このシリーズの説明
- 統計学、データサイエンス、機械学習、金融工学、すべての分野の土台となる数学的基盤を紹介し、それを厳密に証明していく「Tech Math」シリーズのサブシリーズ「中心極限定理(CLT)の完全証明」の記事である.
- 本記事はその第一回「中心極限定理(CLT)の完全証明その1:直感的な説明」であり、直観的な説明を与える
- シリーズ一覧
Abstract
中心極限定理(CLT)の意味と直感的説明を記す
直感的説明
中心極限定理とは、独立同分布(i.i.d.)な確率変数の和や平均を考えたとき、それらの分布が元の確率変数の分布に関わらず、正規分布 に分布収束することを述べる定理である。
例えば、複数のコインを同時に投げ、(表が出た枚数) - (裏が出た枚数)の値を記録するという実験を 10,000回 繰り返したとする。このとき、一度に投げるコインの個数(サンプルサイズ)を 2個、10個、30個と増やしていくと、記録した和の分布は次第に正規分布に近づくことが観察される。
この現象を数学的に表現すると、次のようになる。
確率変数
先ほどのコインの例を考える.
だから、
一般論に戻ろう. ここまでは、確率変数
コインの場合はベルヌーイ分布であったが、分布は何でもよい. たとえばサイコロの場合は離散一様分布、めったに起こらない現象の計数の場合はポアソン分布、となるが、いずれも同じく
証明の方針
- ひとまずは 独立同分布な確率変数列に対する中心極限定理の証明を目標にする
- 同分布ではないバージョンのCLT、独立でなくても成り立つバージョンのCLTもある.
- 通常は後々の応用(たとえばブラウン運動の構成)を考慮して一般の完備可分距離空間
上で理論を展開する場合が多いが、今回は簡単のため、適宜S として議論を進める.S = \mathbb{R}
次回
次回は、CLTの証明までの道筋について述べる。(次回記事 -> 「中心極限定理(CLT)の完全証明その2~証明の道筋~」 )
Discussion