📊

【統計検定準1級】適合度検定

に公開

はじめに

この記事では、統計検定準1級取得に向けて学習したことをまとめていきます。
工学系の数学ではなく数理あるあるの、論述ゴリゴリな解答になっていると思いますのであらかじめご了承ください。
注意:さらに計算過程は数学文化の『省略の美』を無視してエレファントに書いています。

【リンク紹介】
統計検定準1級のまとめ記事一覧
これまで書いたシリーズ記事一覧

学習書籍について

この記事では「統計学実践ワークブック」を中心に、学んだことをまとめていきます。記事を読んで本格的に勉強してみたいなと思った方は、是非ご購入を検討なさってください。


参考書籍について

統計実践ワークブックは、大量の知識項目と問題が収められている反面、計算過程や知識背景が大きく省略されているため、知識体系をきちんと学ぶ参考書として東京大学から出版されている名著「統計学入門」を使っています。


適合度検定

データにある確率分布を当てはめるとき、当てはめの良さを検定するものを適合度検定という。

例題(一様性の適合度検定)

(「統計学入門」より)
あるサイコロをふったところ,出た目は次の通りであった。

1(20回) 2(12回) 3(9回) 4(16回) 5(11回) 6(22回)

これは公平なサイコロといえるか.

例題の解答

「公平なサイコロである」とは、各目の出る確率が\cfrac{1}{6}、つまり確率分布(離散)一様分布であるということである。以上のことから、
「あてはまる確率分布は一様分布である」という仮説を帰無仮説H_0とし、
「当てはまる確率分布は一様分布ではない」という仮説を対立仮説H_1
として、統計的仮説検定を行う。ただし有意水準は\alpha = 0.05であると仮定する。

ここで、求めるにあたって次のことを定める。

サイコロの出た目(事象、カテゴリー、分類項目)をE_iとし、出た目E_iの回数(観測度数、実測度数)をx_iE_iの理論確率をp_iE_iの期待度数(理論値、理論度数)をn p_iとする。ただし、i = 1, 2, 3, \cdots, 6とし、n = x_1 + x_2 + \cdots + x_6とする。

これらを次のように表すこととする。

出た目 E_1 E_2 E_3 E_4 E_5 E_6 合計
出た目の回数
(観測度数)
x_1 x_2 x_3 x_4 x_5 x_6 n
理論確率 p_1 p_2 p_3 p_4 p_5 p_6 1
期待度数
(理論度数)
n p_1 n p_2 n p_3 n p_4 n p_5 n p_6 n

今、帰無仮説H_0と対立仮説H_1をそれぞれ次のように仮定する。

H_0 \ : \ すべてのiに対して \ p_i = \cfrac{1}{6} \\ H_1 \ : \ すべてのiに対して \ p_i \neq \cfrac{1}{6}

よって帰無仮説H_0を仮定して、仮定が棄却されるかを調べる。つまり

すべてのiに対して \ p_i = \cfrac{1}{6}

とする。ここで題意より、E_1 = 1, E_2 = 2, \cdots, E_6とすると、表は以下のようになる。

出た目 E_1 = 1 E_2 = 2 E_3 = 3 E_4 = 4 E_5 = 5 E_6 = 6 合計
出た目の回数
(観測度数)
20 12 9 16 11 22 90
理論確率 \cfrac{1}{6} \cfrac{1}{6} \cfrac{1}{6} \cfrac{1}{6} \cfrac{1}{6} \cfrac{1}{6} 1
期待度数
(理論度数)
15 15 15 15 15 15 90

さらに、統計量Y

Y = \sum_{i = 1}^{6} \cfrac{(x_i - n p_i)^2}{n p_i}

と定める(これをピアソンのカイ二乗統計量という。)。すると、Yは自由度6 - 1 = 5カイ2乗分布に従う。よって有意水準が\alpha = 0.05であることとカイ2乗分布表を用いて、棄却域Rを、

\begin{alignat*}{2} R &= \{ y | y > \chi^2_{0.05} (5)\} \\ &= \{ y | y > 11.07 \} \end{alignat*}

と定めると、Yの実現値y

\begin{alignat*}{2} y &= \cfrac{1}{15} \left( (20 - 15)^2 + (12 - 15)^2 + (9 - 15)^2 + (16 - 15)^2 + (11 - 15)^2 + (22 - 15)^2 \right) \\ &= \cfrac{1}{15} \left( 25 + 9 + 36 + 1 + 16 + 49 \right) \\ &= \cfrac{136}{15} \\ &= 9.067 \notin R \end{alignat*}

したがって帰無仮説H_0は棄却されない。つまりあてはまる確率分布は一様分布である。
ちなみにこの検定を、カイ二乗適合度検定という。



参考資料

\bf{\textcolor{red}{記事が役に立った方は「いいね」を押していただけると、すごく喜びます \ 笑}}
ご協力のほどよろしくお願いします。

Discussion