はじめに
この記事では、統計検定準1級取得に向けて学習したことをまとめていきます。
工学系の数学ではなく数理あるあるの、論述ゴリゴリな解答になっていると思いますのであらかじめご了承ください。
注意:さらに計算過程は数学文化の『省略の美』を無視してエレファントに書いています。
【リンク紹介】
・統計検定準1級のまとめ記事一覧
・これまで書いたシリーズ記事一覧
学習書籍について
この記事では「統計学実践ワークブック」を中心に、学んだことをまとめていきます。記事を読んで本格的に勉強してみたいなと思った方は、是非ご購入を検討なさってください。

参考書籍について
統計実践ワークブックは、大量の知識項目と問題が収められている反面、計算過程や知識背景が大きく省略されているため、知識体系をきちんと学ぶ参考書として東京大学から出版されている名著「統計学入門」を使っています。

母平均の検定
[1] 母分散が既知のとき
例題
(「統計学入門」より)
ある中学校で1年生44名に集団式知能検査を実施したところ、偏差値の平均は55.4であった。この学校の1年生は平均的な生徒といえるか.ただし,知能の偏差値はN(50, 10^2)に従うといわれている。
(解答)
「この学校の1年生は平均的な生徒である」という仮説を帰無仮説H_0とし、
「このが学校の1年生は平均的な生徒ではない」という仮説を対立仮説%H_1
として、統計的仮説検定を行う。ただし有意水準は\alpha = 0.05であると仮定する。
X_1, X_2, \cdots, X_{44}を、正規母集団N(\mu, {\sigma}^2)から取り出した標本とする。X_1, X_2, \cdots, X_{44}は互いに独立でN(\mu, {\sigma}^2)に従う。
今、帰無仮説H_0と対立仮説H_1をそれぞれ次のように仮定する。
H_0 \ : \ \mu = 50 \\
H_1 \ : \ \mu \neq 50
よって帰無仮説H_0を仮定して、仮定が棄却されるかを調べる。つまり
\mu = 50 \\
{\sigma}^2 = 10^2
とする。
ここで、
\begin{alignat*}{2}
\overline{X} &= \cfrac{X_1 + X_2 + \cdots + X_{44}}{44} \\
\end{alignat*}
とおくと、正規分布の再生性より、\overline{X}は正規分布N(50, \frac{10^2}{44})に従う。ここで確率変数Zを
Z = \cfrac{\overline{X} - 50}{\sqrt{\cfrac{10^2}{44}}}
とおけば、Zは標準正規分布N(0, 1)に従う。よって有意水準が\alpha = 0.05であることと標準正規分布表を用いて、棄却域Rを
\begin{alignat*}{2}
R &= \{ z | \left| z \right| > 1.96 \} \\
&= \{ z | z < -1.96, 1.96 < z \}
\end{alignat*}
と定める。ここで、ある中学校の1年44名の偏差値の平均が55.4であることから、Zの実現値zは
\begin{alignat*}{2}
z &= \cfrac{55.4 - 50}{\sqrt{\cfrac{10^2}{44}}} \\
&= 3.582 \in R
\end{alignat*}
であるので、帰無仮説H_0は棄却される。つまりこの学校の1年生の生徒は平均的ではない。
[2] 母分散が未知のとき
例題
(「統計学入門」より)
ある県での統計によると,満6才の児童の平均身長は108.6cmであるという.A小学校6才児27名についてしらべたところ,\overline{x} = 109.7cm,s = 3.98cmであった.この結果から,同校児童の身長は県平均に比べ高いといえるか.
※sは標準偏差である。
(解答)
「A小学校児童の身長は平均的な身長である」という仮説を帰無仮説H_0とし、
「A小学校児童の身長は平均的な身長ではない」という仮説を対立仮説%H_1
として、統計的仮説検定を行う。ただし有意水準は\alpha = 0.05であると仮定する。
X_1, X_2, \cdots, X_{27}を、正規母集団N(\mu, {\sigma}^2)から取り出した標本とする。X_1, X_2, \cdots, X_{27}は互いに独立でN(\mu, {\sigma}^2)に従う。
今、帰無仮説H_0と対立仮説H_1をそれぞれ次のように仮定する。
H_0 \ : \ \mu = 108.6 \\
H_1 \ : \ \mu \neq 108.6
よって帰無仮説H_0を仮定して、仮定が棄却されるかを調べる。つまり、
とする。ここで、母分散{\sigma}^2は未知であるが、代わりに標準偏差sを用いて標本分散s^2がわかっている。よって母分散{\sigma}^2の推定値として不偏標本分散U^2を用いる。つまり
\begin{alignat*}{2}
U^2 &= \cfrac{27}{27 - 1} s^2 \\
&= \frac{27}{26} \times {3.98}^2
\end{alignat*}
である。よって正規母集団をN \left(108.6, {\left( 3.98 \sqrt{\frac{27}{26}} \right)}^2 \right)とみなす。
ここで、
\begin{alignat*}{2}
\overline{X} &= \cfrac{X_1 + X_2 + \cdots + X_{44}}{44} \\
\end{alignat*}
とおき、さらに確率変数Tを
T = \cfrac{\overline{X} - 108.6}{ \cfrac{3.98 \sqrt{\cfrac{27}{26}}}{\sqrt{27}} }
とおけば、Tは自由度26のt分布に従う(詳しくは母平均の区間推定を参照)。よって棄却域Rを、t分布表を用いて
\begin{alignat*}{2}
R &= \{ t | |t| > t_{0.025}(26) \} \\
&= \{ t | t < -2.056, 2.056 < t \}
\end{alignat*}
と定める。ここでA小学校6才児27名の平均身長が\overline{x} = 109.7cmであることから、Tの実現値tは
\begin{alignat*}{2}
t &= \cfrac{109.7 - 108.6}{ \cfrac{3.98 \sqrt{\cfrac{27}{26}}}{\sqrt{27}} } \\
&= \cfrac{1.1}{ \cfrac{3.98}{\sqrt{26}} } \\
&= \cfrac{1.1 \sqrt{26}}{3.98} \\
&\fallingdotseq \cfrac{1.1 \times 5.099}{3.98} \\
&= \cfrac{5.6086}{3.98} \\
&\fallingdotseq 1.4092 \notin R
\end{alignat*}
であるので、帰無仮説H_0は棄却されない。つまりA小学校児童の身長は平均的な身長である。
参考資料
\bf{\textcolor{red}{記事が役に立った方は「いいね」を押していただけると、すごく喜びます \ 笑}}
ご協力のほどよろしくお願いします。
Discussion