はじめに
この記事では、統計検定準1級取得に向けて学習したことをまとめていきます。
工学系の数学ではなく数理あるあるの、論述ゴリゴリな解答になっていると思いますのであらかじめご了承ください。
注意:さらに計算過程は数学文化の『省略の美』を無視してエレファントに書いています。
【リンク紹介】
・統計検定準1級のまとめ記事一覧
・これまで書いたシリーズ記事一覧
学習書籍について
この記事では「統計学実践ワークブック」を中心に、学んだことをまとめていきます。記事を読んで本格的に勉強してみたいなと思った方は、是非ご購入を検討なさってください。

参考書籍について
統計実践ワークブックは、大量の知識項目と問題が収められている反面、計算過程や知識背景が大きく省略されているため、知識体系をきちんと学ぶ参考書として東京大学から出版されている名著「統計学入門」を使っています。

母分散の比の検定
例題
(「統計学入門」より)
ある動物を2群に分け,2種類のエサA, Bを与えて成長の差を調べ体重(g)のデータを得た。両エサのばらつきは同じといえるか.
|
平均 |
分散 |
サンプル数 |
A |
168.1 |
8.8 |
10 |
B |
164.3 |
10.1 |
8 |
例題の解答
「両エサのばらつきは同じである」という仮説を帰無仮説H_0とし、
「両エサのばらつきは同じではない」という仮説を対立仮説H_1
として、統計的仮説検定を行う。ただし有意水準は\alpha = 0.1であると仮定する。
Aの正規母集団をN(\mu_1, {\sigma_1}^2)、Bの正規母集団をN(\mu_2, {\sigma_2}^2)とする。
ただし、\mu_1, \mu_2は母平均、{\sigma_1}^2, {\sigma_2}^2は母分散とする。
今、帰無仮説H_0と対立仮説H_1をそれぞれ次のように仮定する。
H_0 \ : \ {\sigma_1}^2 = {\sigma_2}^2 \\
H_1 \ : \ {\sigma_1}^2 \neq {\sigma_2}^2
よって帰無仮説H_0を仮定して、仮定が棄却されるかを調べる。つまり
{\sigma_1}^2 = {\sigma_2}^2
とする。ここでAの標本の大きさがn_1の標本分散をそれぞれ{S_1}^2、Bの標本の大きさがn_2の標本分散を{S_2}^2とし、統計量{X_1}^2, {X_2}^2をそれぞれ
{X_1}^2 = \cfrac{n_1}{{\sigma_1}^2} {S_1}^2 \\
{X_2}^2 = \cfrac{n_2}{{\sigma_2}^2} {S_2}^2 \\
{X_1}^2, {X_2}^2は母分散が未知のときの母平均の区間推定の時と同様にそれぞれ自由度n_1 - 1, n_2 - 1のカイ2乗分布に従う。さらに統計量Fを
F = \cfrac{\cfrac{{X_1}^2}{n_1 - 1}}{\cfrac{{X_2}^2}{n_2 - 1}}
とおくと、Fは自由度(n_1 - 1, n_2 - 1)のF分布に従う。題意よりn_1 = 10, n_2 = 8であるからn_1 - 1 = 9, n_2 - 1 = 7であることと、棄却域Rを、F分布表を用いて
\begin{alignat*}{2}
R &= \{ f | f < F_{0.95} (9, 7), F_{0.05} (9, 7) < f \} \\
&= \left\{ f | f < \cfrac{1}{F_{0.05} (9, 7)}, F_{0.05} (9, 7) < f \right\} \\
&= \left\{ f | f < \cfrac{1}{3.29}, 3.68 < f \right\} \\
&= \{ f | f < 0.304, 3.68 < f \} \\
\end{alignat*}
と定める。ここで仮定より
{\sigma_1}^2 = {\sigma_2}^2 \Leftrightarrow \cfrac{{\sigma_2}^2}{{\sigma_1}^2} = 1
であるので、
\begin{alignat*}{2}
F
&= \cfrac{\cfrac{{X_1}^2}{n_1 - 1}}{\cfrac{{X_2}^2}{n_2 - 1}} \\
&= \cfrac{\cfrac{\cfrac{n_1}{{\sigma_1}^2} {S_1}^2}{n_1 - 1}}
{\cfrac{\cfrac{n_2}{{\sigma_2}^2} {S_2}^2}{n_2 - 1}} \\
&= \cfrac{\cfrac{\cfrac{n_1}{{\sigma_1}^2} {S_1}^2}{n_1 - 1} \times
(n_1 - 1)(n_2 - 1)
}
{\cfrac{\cfrac{n_2}{{\sigma_2}^2} {S_2}^2}{n_2 - 1} \times
(n_1 - 1)(n_2 - 1)
} \\
&= \cfrac{\cfrac{n_1}{{\sigma_1}^2} {S_1}^2 \times (n_2 - 1)}
{\cfrac{n_2}{{\sigma_2}^2} {S_2}^2 \times (n_1 - 1)} \\
&= \cfrac{\cfrac{n_1}{{\sigma_1}^2} {S_1}^2 \times (n_2 - 1) \times
{\sigma_1}^2 {\sigma_2}^2
}
{\cfrac{n_2}{{\sigma_2}^2} {S_2}^2 \times (n_1 - 1) \times
{\sigma_1}^2 {\sigma_2}^2
} \\
&= \cfrac{n_1 {S_1}^2 \times (n_2 - 1) \times {\sigma_2}^2}
{n_2 {S_2}^2 \times (n_1 - 1) \times {\sigma_1}^2} \\
&= \cfrac{{\sigma_2}^2}{{\sigma_1}^2} \times
\cfrac{n_1 {S_1}^2 \times (n_2 - 1)}
{n_2 {S_2}^2 \times (n_1 - 1)} \\
&= 1 \times
\cfrac{n_1 (n_2 - 1)}
{n_2 (n_1 - 1)} \times
\cfrac{{S_1}^2}{{S_2}^2} \\
\end{alignat*}
と表すことができ、そして題意より
{S_1}^2 = 8.8 \\
{S_2}^2 = 10.1
であることから、Fの実現値fは次のように求めることができる。
\begin{alignat*}{2}
f
&= \cfrac{10 \times (8 - 1)}{8 \times (10 - 1)} \times
\cfrac{8.8}{10.1} \\
&= \cfrac{10 \times 7}{8 \times 9} \times
\cfrac{8.8}{10.1} \\
&= \cfrac{70}{72} \times
\cfrac{8.8}{10.1} \\
&= \cfrac{616}{727.2} \\
&\fallingdotseq 0.847 \notin R
\end{alignat*}
したがって帰無仮説H_0は棄却されない。つまり両エサのばらつきは同じである。
余談:統計量と不偏標本分散の関係
解答では、統計量Fを標本分散{S_1}^2, {S_2}^2を用いて
F = \cfrac{\cfrac{\cfrac{n_1}{{\sigma_1}^2} {S_1}^2}{n_1 - 1}}
{\cfrac{\cfrac{n_2}{{\sigma_2}^2} {S_2}^2}{n_2 - 1}}
と表したが、ここで不偏標本分散{U_1}^2, {U_2}^2をそれぞれ
{U_1}^2 = \cfrac{n}{n - 1} {S_1}^2 \\
{U_2}^2 = \cfrac{n}{n - 1} {S_2}^2
と定めると、統計量Fは以下のようになる。
\begin{alignat*}{2}
F
&= \cfrac{\cfrac{1}{{\sigma_1}^2} \times \cfrac{n_1}{n_1 - 1} {S_1}^2}
{\cfrac{1}{{\sigma_2}^2} \times \cfrac{n_2}{n_2 - 1} {S_2}^2} \\
&= \cfrac{\cfrac{1}{{\sigma_1}^2} \times {U_1}^2}
{\cfrac{1}{{\sigma_2}^2} \times {U_2}^2} \\
&= \cfrac{{\sigma_2}^2}{{\sigma_1}^2}
\times
\cfrac{{U_1}^2}{{U_2}^2} \\
\end{alignat*}
ここで、帰無仮説を仮定していることから、次のことが成り立っている。
\cfrac{{\sigma_2}^2}{{\sigma_1}^2} = 1
ゆえに、
F = \cfrac{{U_1}^2}{{U_2}^2}
が成り立つ。このように、等分散性を仮定している場合に限り、統計量Fは不偏標本分散を用いてシンプルに表すことができる。
参考資料
\bf{\textcolor{red}{記事が役に立った方は「いいね」を押していただけると、すごく喜びます \ 笑}}
ご協力のほどよろしくお願いします。
Discussion