📊

【統計検定準1級】カイ2乗分布

2024/08/04に公開

はじめに

この記事では、統計検定準1級取得に向けて学習したことをまとめていきます。
工学系の数学ではなく数理あるあるの、論述ゴリゴリな解答になっていると思いますのであらかじめご了承ください。
注意:さらに計算過程は数学文化の『省略の美』を無視してエレファントに書いています。

【リンク紹介】
統計検定準1級のまとめ記事一覧
これまで書いたシリーズ記事一覧

学習書籍について

この記事では「統計学実践ワークブック」を中心に、学んだことをまとめていきます。記事を読んで本格的に勉強してみたいなと思った方は、是非ご購入を検討なさってください。


参考書籍について

統計実践ワークブックは、大量の知識項目と問題が収められている反面、計算過程や知識背景が大きく省略されているため、知識体系をきちんと学ぶ参考書として東京大学から出版されている名著「統計学入門」を使っています。
※ワークブックとしては素晴らしい質だと思いますが、どうしてもその内容量とページ数の都合上、問題のない範囲で削除されているということです。人によっては1冊で問題ない方もおられると思いますが、私には無理でした。


カイ2乗分布

確率変数X_i \ (1 \leqq i \leqq n)が独立でそれぞれ標準正規分布N(0, 1)に従うとする。このとき、統計量Y

Y = {X_{1}}^{2} + {X_{2}}^{2} + \cdots + {X_{n}}^{2}

とおくとき、Y確率密度関数f

\begin{alignat*}{2} f(y) &= \cfrac{1}{2^{\frac{n}{2}} \ \Gamma \left( \frac{n}{2} \right)} \ y^{\frac{n}{2} - 1} e^{- \frac{y}{2}} \hspace{5mm} (y > 0) \end{alignat*}

であるとき、この確率密度関数f自由度nカイ2乗分布(chi-square distribution with n degrees of freedom)といい、\chi^2 (n)と表す。ただし、\Gammaガンマ分布のガンマ関数を表し、

\Gamma \left( \frac{n}{2} \right) = \int_{0}^{\infty} x^{\frac{n}{2} - 1} e^{-x} dx

である。

グラフの描画

コードはこちら

参考資料→Pythonで理解する統計解析の基礎
※参考にはしていますが表記は大分変更しています。

import numpy as np
import matplotlib.pyplot as plt
import japanize_matplotlib                    # グラフ上での日本語表示
from scipy import stats, integrate
from scipy.optimize import minimize_scalar    # 関数の最小値を求める

# 表示桁数を小数点以下第3位に設定
%precision 3

# [Jupyter notebook only]
# グラフ表示を非インタラクティブモード(jupyter notebook内に表示)に設定
# インタラクティブモードだと別ウィンドウで表示される
%matplotlib inline

linestyles = ['-', '--', ':']
colors = ['#006C4F', '#ee7800', '#3155A6']

fig = plt.figure(figsize = (10, 6))
ax  = fig.add_subplot(111)

# 0から20までのサンプルを500個生成
x = np.linspace(0, 20, 500)

for n, ls, color in zip([3, 5, 10], linestyles, colors):

    # 自由度nのカイ二乗分布をインスタンス化
    rv = stats.chi2(n)
    
    ax.plot(x, rv.pdf(x),
            label = f'自由度{n}のカイ二乗分布',
            ls    = ls,
            color = color
           )

ax.legend()
plt.show()

カイ2乗分布の再生性

m, nを正の整数とし、確率変数X, Yが互いに独立であるとする。このとき、

Xが自由度mのカイ2乗分布\chi^2 (m)に従い、かつYが自由度nのカイ2乗分布\chi^2 (n)に従う」
ならば、「X + Yが自由度m + nのカイ2乗分布\chi^2 (m + n)に従う。」

カイ2乗分布の期待値

E[Y]Y期待値

E[Y] = n

カイ2乗分布の分散

V[Y]Y分散

V[Y] = 2n

カイ2乗分布のモーメント母関数

m(\theta) = E[e^{\theta Y}]Yモーメント母関数

\begin{alignat*}{2} m(\theta) &= E[e^{\theta Y}] \\ &= (1 - 2 \theta)^{- \frac{n}{2}} \hspace{5mm} \left( \theta < \cfrac{1}{ \ 2 \ } \right) \\ \end{alignat*}

非心カイ2乗分布

確率変数X_i \ (1 \leqq i \leqq n)が独立でそれぞれ正規分布N(\mu_i, 1)に従うとする。
統計量Y

Y = {X_{1}}^{2} + {X_{2}}^{2} + \cdots + {X_{n}}^{2}

とし、

\lambda = {\mu_{1}}^{2} + {\mu_{2}}^{2} + \cdots + {\mu_{n}}^{2}

とする。このときYの確率密度関数f

\begin{alignat*}{2} f(y) &= \sum_{k = 0}^{\infty} \cfrac{e^{- \frac{\lambda}{2}} \ (\frac{\lambda}{2})^k}{k!} \cdot \cfrac{1}{2^{\frac{n}{2} + k} \ \Gamma(\frac{n}{2} + k)} \ y^{\frac{n}{2} + k - 1} \ e^{- \frac{y}{2}} \hspace{5mm} (y > 0) \end{alignat*}

であるとき、この確率密度関数f自由度n非心度\lambda非心カイ2乗分布といい、\chi^2 (n, \lambda)と表す。ただし、\Gammaはガンマ分布のガンマ関数を表し、

\Gamma \left( \frac{n}{2} + k \right) = \int_{0}^{\infty} x^{\frac{n}{2} + k - 1} e^{-x} dx

である。

※確率密度関数は以下のサイトを参考にしました。
https://pystyle.info/statistics-noncentral-chi-square-distribution/

非心カイ2乗分布の期待値

E[Y]Y期待値

E[Y] = n + \lambda

非心カイ2乗分布の分散

V[Y]Y分散

V[Y] = 2n + 4 \lambda

非心カイ2乗分布のモーメント母関数

m(\theta) = E[e^{\theta Y}]Yモーメント母関数

\begin{alignat*}{2} m(\theta) &= E[e^{\theta Y}] \\ &= (1 - 2 \theta)^{- \frac{n}{2}} \exp \left( \cfrac{\lambda \theta}{1 - 2 \theta} \right) \hspace{5mm} \left( \theta < \cfrac{1}{ \ 2 \ } \right) \\ \end{alignat*}

参考資料

\bf{\textcolor{red}{記事が役に立った方は「いいね」を押していただけると、すごく喜びます \ 笑}}
ご協力のほどよろしくお願いします。

Discussion