はじめに
この記事では、統計検定準1級取得に向けて学習したことをまとめていきます。
工学系の数学ではなく数理あるあるの、論述ゴリゴリな解答になっていると思いますのであらかじめご了承ください。
注意:さらに計算過程は数学文化の『省略の美』を無視してエレファントに書いています。
【リンク紹介】
・統計検定準1級のまとめ記事一覧
・これまで書いたシリーズ記事一覧
学習書籍について
この記事では「統計学実践ワークブック」を中心に、学んだことをまとめていきます。記事を読んで本格的に勉強してみたいなと思った方は、是非ご購入を検討なさってください。

参考書籍について
統計実践ワークブックは、大量の知識項目と問題が収められている反面、計算過程や知識背景が大きく省略されているため、知識体系をきちんと学ぶ参考書として東京大学から出版されている名著「統計学入門」を使っています。

母比率の差の検定
例題
(「統計学入門」より)
ある意見項目に対する賛否を男女別に集計したところ,次の結果を得た.賛成者の比率に男女差ありといえるか.
|
賛成 |
反対 |
計 |
男 |
58(0.592) |
40(0.408) |
98(1.000) |
女 |
28(0.394) |
43(0.606) |
71(1.000) |
例題の解答
「賛成者の比率に男女差はない」という仮説を帰無仮説H_0とし、
「賛成者の比率に男女差がある」という仮説を対立仮説H_1
として、統計的仮説検定を行う。ただし有意水準は\alpha = 0.05であると仮定する。
男の賛成者の母比率を\pi_1、女の賛成者の母比率を\pi_2とする。また、サイズn_1の標本のうち男の賛成者の数X_1は二項分布Bin (n_1, \pi_1)に従い、サイズn_2の標本のうち女の賛成者の数X_2は二項分布Bin (n_2, \pi_2)に従う。
このとき、帰無仮説H_0と対立仮説H_1をそれぞれ次のように仮定する。
H_0 \ : \ \pi_1 = \pi_2 \\
H_1 \ : \ \pi_1 \neq \pi_2
よって帰無仮説H_0を仮定して、仮定が棄却されるかを調べる。つまり
とする。ここで題意より、
n_1 = 98 , \ n_2 = 71 \ \cdots \ ①
であり、標本数が十分に大きいためX_1, X_2はそれぞれ近似的に正規分布N(n_1 \pi_1, n_1 \pi_1 (1 - \pi_1)), N(n_2 \pi_2, n_2 \pi_2 (1 - \pi_2))に従う。
ゆえに、正規分布の再生性より\cfrac{X_1}{n_1}, \cfrac{X_2}{n_2}はN \left(\pi_1, \cfrac{\pi_1 (1 - \pi_1)}{n_1} \right), N \left(\pi_2, \cfrac{\pi_2 (1 - \pi_2)}{n_2} \right)にそれぞれ従う。
(※ここから先は、母平均の検定(母分散既知ver)と同じです。)
もう一度、正規分布の再生性より
\cfrac{X_1}{n_1} - \cfrac{X_2}{n_2}は正規分布N \left(\pi_1 - \pi_2, \cfrac{\pi_1 (1 - \pi_1)}{n_1} + \cfrac{\pi_2 (1 - \pi_2)}{n_2} \right)に従う。
ここで確率変数Zを
Z = \cfrac
{(\cfrac{X_1}{n_1} - \cfrac{X_2}{n_2}) - (\pi_1 - \pi_2)}
{\sqrt{\cfrac{\pi_1 (1 - \pi_1)}{n_1} + \cfrac{\pi_2 (1 - \pi_2)}{n_2}}}
とおけば、Zは標準正規分布N(0, 1)に従う。よって有意水準が\alpha = 0.05であることと標準正規分布表を用いて、棄却域Rを
\begin{alignat*}{2}
R &= \{ z | \left| z \right| > 1.96 \} \\
&= \{ z | z < -1.96, 1.96 < z \}
\end{alignat*}
と定める。ここで仮定より
\pi_1 = \pi_2 \Leftrightarrow \pi_1 - \pi_2 = 0 \ \cdots \ ②
であり、題意より
\cfrac{X_1}{n_1} = \cfrac{58}{98} = 0.592 \ \cdots \ ③ \\
\cfrac{X_1}{n_1} = \cfrac{28}{71} = 0.394 \ \cdots \ ④
である。さらに母比率\pi_1, \pi_2は未知であるが、母比率とは母平均であることから、
母比率\pi_1を標本比率\cfrac{X_1}{n_1} = 0.592で推定し、\ \cdots \ ⑤
母比率\pi_2を標本比率\cfrac{X_2}{n_2} = 0.394で推定する。\ \cdots \ ⑥
以上、①~⑥よりZの実現値zは
\begin{alignat*}{2}
z
&= \cfrac{(0.592 - 0.394) - 0}
{\sqrt{\cfrac{0.592 \times 0.408}{98} + \cfrac{0.394 \times 0.606}{71}}} \\
&= \cfrac{0.198}
{\sqrt{\cfrac{0.241536}{98} + \cfrac{0.238764}{71}}} \\
&\fallingdotseq \cfrac{0.198}{\sqrt{0.0025 + 0.0034}} \\
&= \cfrac{0.198}{\sqrt{0.0059}} \\
&\fallingdotseq \cfrac{0.198}{0.077} \\
&\fallingdotseq 2.571 \in R
\end{alignat*}
したがって帰無仮説H_0は棄却される。つまり賛成者の比率に男女差がある。
参考資料
\bf{\textcolor{red}{記事が役に立った方は「いいね」を押していただけると、すごく喜びます \ 笑}}
ご協力のほどよろしくお願いします。
Discussion