はじめに
この記事では、統計検定準1級取得に向けて学習したことをまとめていきます。
工学系の数学ではなく数理あるあるの、論述ゴリゴリな解答になっていると思いますのであらかじめご了承ください。
注意:さらに計算過程は数学文化の『省略の美』を無視してエレファントに書いています。
【リンク紹介】
・統計検定準1級のまとめ記事一覧
・これまで書いたシリーズ記事一覧
学習書籍について
この記事では「統計学実践ワークブック」を中心に、学んだことをまとめていきます。記事を読んで本格的に勉強してみたいなと思った方は、是非ご購入を検討なさってください。
参考書籍について
統計実践ワークブックは、大量の知識項目と問題が収められている反面、計算過程や知識背景が大きく省略されているため、知識体系をきちんと学ぶ参考書として東京大学から出版されている名著「統計学入門」を使っています。
※ワークブックとしては素晴らしい質だと思いますが、どうしてもその内容量とページ数の都合上、問題のない範囲で削除されているということです。人によっては1冊で問題ない方もおられると思いますが、私には無理でした。
区間推定
データを用いて未知母数\thetaの値の存在範囲を区間として推定する方法を区間推定(interval estimation)という。
母平均の区間推定
X_{11}, X_{12}, \cdots, X_{1{n_1}}を、母集団からの無作為標本とし、X_{11}, X_{12}, \cdots, X_{1{n_1}}は互いに独立で、それぞれ同一の(母平均{\mu}_1、母分散{{\sigma}_1}^2の)正規分布N({\mu}_1, {{\sigma}_1}^2)に従うとする。
さらに、
X_{21}, X_{22}, \cdots, X_{2{n_1}}を、母集団からの無作為標本とし、X_{21}, X_{22}, \cdots, X_{2{n_1}}は互いに独立で、それぞれ同一の(母平均{\mu}_2、母分散{{\sigma}_2}^2の)正規分布N({\mu}_2, {{\sigma}_2}^2)に従うとする。
このとき、母分散の比\cfrac{{{\sigma}_1}^2}{{{\sigma}_2}^2}の区間推定を行う。
X_{11}, X_{12}, \cdots, X_{1{n_1}}において不偏標本分布を{U_1}^2とする。つまり、
{U_1}^2 = \cfrac{1}{n_1 - 1} \sum_{i = 1}^{n} (X_{1i} - \overline{X_1})^2
である。さらに
X_{21}, X_{22}, \cdots, X_{2{n_2}}において不偏標本分布を{U_2}^2とする。つまり、
{U_2}^2 = \cfrac{1}{n_2 - 1} \sum_{i = 1}^{n} (X_{2i} - \overline{X_2})^2
ここで、統計量
\cfrac{ \ \ \cfrac{{U_1}^2}{ \ \ {\sigma_1}^2 \ \ } \ \ }
{\cfrac{{U_2}^2}{{\sigma_2}^2}}
は、自由度(n_1 - 1, n_2 - 1)のF分布に従う。ここで、F分布表から次の式が成り立つ。
P
\left(
F_{0.975} (n_1 - 1, n_2 - 1) \leqq
\cfrac{ \ \ \cfrac{{U_1}^2}{ \ \ {\sigma_1}^2 \ \ } \ \ }{\cfrac{{U_2}^2}{{\sigma_2}^2}} \leqq
F_{0.025} (n_1 - 1, n_2 - 1)
\right)
= 0.95
ただし、自由度(n_1 - 1, n_2 - 1)のF分布の上側確率\alphaに対するF_{\alpha} (n_1 - 1, n_2 - 1)とする。すると、
\begin{alignat*}{2}
P \left(
F_{0.975} (n_1 - 1, n_2 - 1) \leqq
\cfrac{ \ \ \cfrac{{U_1}^2}{ \ \ {\sigma_1}^2 \ \ } \ \ }{\cfrac{{U_2}^2}
{{\sigma_2}^2}} \leqq
F_{0.025} (n_1 - 1, n_2 - 1)
\right) &= 0.95 \\
P \left(
\cfrac{1}{F_{0.025} (n_1 - 1, n_2 - 1)} \leqq
\cfrac{ \ \ \cfrac{{U_2}^2}{ \ \ {\sigma_2}^2 \ \ } \ \ }{\cfrac{{U_1}^2}
{{\sigma_1}^2}} \leqq
\cfrac{1}{F_{0.975} (n_1 - 1, n_2 - 1)}
\right) &= 0.95 \\
P \left(
\cfrac{1}{F_{0.025} (n_1 - 1, n_2 - 1)} \leqq
\cfrac{\cfrac{{U_2}^2}{{\sigma_2}^2} \cdot ({\sigma_1}^2 \cdot {\sigma_2}^2)}
{\cfrac{{U_1}^2}{{\sigma_1}^2} \cdot ({\sigma_1}^2 \cdot {\sigma_2}^2)} \leqq
\cfrac{1}{F_{0.975} (n_1 - 1, n_2 - 1)}
\right) &= 0.95 \\
P \left(
\cfrac{1}{F_{0.025} (n_1 - 1, n_2 - 1)} \leqq
\cfrac{{U_2}^2 \cdot {\sigma_1}^2}
{{U_1}^2 \cdot {\sigma_2}^2} \leqq
\cfrac{1}{F_{0.975} (n_1 - 1, n_2 - 1)}
\right) &= 0.95 \\
P \left(
\cfrac{{U_1}^2}{{U_2}^2} \cdot \cfrac{1}{F_{0.025} (n_1 - 1, n_2 - 1)} \leqq
\cfrac{{\sigma_1}^2}{{\sigma_2}^2} \leqq
\cfrac{{U_1}^2}{{U_2}^2} \cdot \cfrac{1}{F_{0.975} (n_1 - 1, n_2 - 1)}
\right) &= 0.95 \\
\end{alignat*}
となる。以上より、母分散の比\cfrac{{{\sigma}_1}^2}{{{\sigma}_2}^2}の信頼係数0.95の信頼区間は、
\left[
\cfrac{{U_1}^2}{{U_2}^2} \cdot \cfrac{1}{F_{0.025} (n_1 - 1, n_2 - 1)}, \
\cfrac{{U_1}^2}{{U_2}^2} \cdot \cfrac{1}{F_{0.975} (n_1 - 1, n_2 - 1)}
\right]
となる。
参考資料
\bf{\textcolor{red}{記事が役に立った方は「いいね」を押していただけると、すごく喜びます \ 笑}}
ご協力のほどよろしくお願いします。
Discussion