はじめに
この記事では、統計検定準1級取得に向けて学習したことをまとめていきます。
工学系の数学ではなく数理あるあるの、論述ゴリゴリな解答になっていると思いますのであらかじめご了承ください。
注意:さらに計算過程は数学文化の『省略の美』を無視してエレファントに書いています。
【リンク紹介】
・統計検定準1級のまとめ記事一覧
・これまで書いたシリーズ記事一覧
学習書籍について
この記事では「統計学実践ワークブック」を中心に、学んだことをまとめていきます。記事を読んで本格的に勉強してみたいなと思った方は、是非ご購入を検討なさってください。
参考書籍について
統計実践ワークブックは、大量の知識項目と問題が収められている反面、計算過程や知識背景が大きく省略されているため、知識体系をきちんと学ぶ参考書として東京大学から出版されている名著「統計学入門」を使っています。
※ワークブックとしては素晴らしい質だと思いますが、どうしてもその内容量とページ数の都合上、問題のない範囲で削除されているということです。人によっては1冊で問題ない方もおられると思いますが、私には無理でした。
区間推定
データを用いて未知母数\thetaの値の存在範囲を区間として推定する方法を区間推定(interval estimation)という。
二項分布の母比率の区間推定
X_1, X_2, \cdots, X_nを、母集団からの無作為標本とし、それぞれ互いに独立で、同一の二項分布Bin (1, p)に従う確率変数であるとする。このとき、期待値と分散はそれぞれp, p(1 - p)である。
このとき、母比率pの区間推定を行う。
※母比率とは、母集団の中である性質を持っているものの比率のこと。ここでは成功結果が起こる割合(確率)となる。
今、
S_n = X_1 + X_2 + \cdots + X_n
とし、
Z = \cfrac{S_n - np}{\sqrt{n} \sqrt{p(1 - p)}}
とすると、中心極限定理よりZは標準正規分布N(0, 1)に従う。このことから、標準正規分布表より次の式が成り立つ。
\begin{alignat*}{2}
P(- 1.96 \leqq Z \leqq 1.95) &= 0.95 \\
P \left(
- 1.96 \leqq \cfrac{S_n - np}{\sqrt{n} \sqrt{p(1 - p)}} \leqq 1.96
\right) &= 0.95 \\
P \left(
- 1.96 \sqrt{np(1 - p)} \leqq S_n - np \leqq 1.96 \sqrt{np(1 - p)}
\right) &= 0.95 \\
P \left(
- 1.96 \sqrt{np(1 - p)} \leqq np - S_n \leqq 1.96 \sqrt{np(1 - p)}
\right) &= 0.95 \\
P \left(
S_n - 1.96 \sqrt{np(1 - p)} \leqq np \leqq S_n + 1.96 \sqrt{np(1 - p)}
\right) &= 0.95 \\
P \left(
S_n - 1.96 \sqrt{np(1 - p)} \leqq np \leqq S_n + 1.96 \sqrt{np(1 - p)}
\right) &= 0.95 \\
P \left(
\cfrac{1}{n} \left( S_n - 1.96 \sqrt{np(1 - p)} \right) \leqq
p \leqq
\cfrac{1}{n} \left( S_n + 1.96 \sqrt{np(1 - p)} \right)
\right) &= 0.95 \\
P \left(
\cfrac{1}{n} S_n - 1.96 \sqrt{\cfrac{p(1 - p)}{n}} \leqq
p \leqq
\cfrac{1}{n} S_n + 1.96 \sqrt{\cfrac{p(1 - p)}{n}}
\right) &= 0.95 \\
\end{alignat*}
以上より、母比率pの信頼係数0.95の信頼区間は、
\left[
\cfrac{1}{n} S_n - 1.96 \sqrt{\cfrac{p(1 - p)}{n}},
\cfrac{1}{n} S_n + 1.96 \sqrt{\cfrac{p(1 - p)}{n}}
\right]
となる。
参考資料
\bf{\textcolor{red}{記事が役に立った方は「いいね」を押していただけると、すごく喜びます \ 笑}}
ご協力のほどよろしくお願いします。
Discussion