はじめに
この記事では、統計検定準1級取得に向けて学習したことをまとめていきます。
工学系の数学ではなく数理あるあるの、論述ゴリゴリな解答になっていると思いますのであらかじめご了承ください。
注意:さらに計算過程は数学文化の『省略の美』を無視してエレファントに書いています。
【リンク紹介】
・統計検定準1級のまとめ記事一覧
・これまで書いたシリーズ記事一覧
学習書籍について
この記事では「統計学実践ワークブック」を中心に、学んだことをまとめていきます。記事を読んで本格的に勉強してみたいなと思った方は、是非ご購入を検討なさってください。
参考書籍について
統計実践ワークブックは、大量の知識項目と問題が収められている反面、計算過程や知識背景が大きく省略されているため、知識体系をきちんと学ぶ参考書として東京大学から出版されている名著「統計学入門」を使っています。
※ワークブックとしては素晴らしい質だと思いますが、どうしてもその内容量とページ数の都合上、問題のない範囲で削除されているということです。人によっては1冊で問題ない方もおられると思いますが、私には無理でした。
超幾何分布
2種類A, BからなるN個のものがあるとする。また、それぞれの個数をM, N - Mとする(N, Mは自然数)。この集団から非復元無作為抽出でn個取り出したとき、Aがx個、Bがn - x個であるとする。このとき、xの確率関数pが
\begin{alignat*}{2}
P(X = x) &= p(x) \\
&= \cfrac{{}_M C_x \cdot {}_{N - M} C_{n - x}}{{}_N C_n} \\
\end{alignat*}
\\
(Max(0, n - (N - M)) \leqq x \leqq Min(n, M)
であるとき、この確率関数pを超幾何分布(hypergeometric distribution)といい、HG(N, M, n)で表す。
超幾何分布の期待値
E[X]:Xの期待値
E[X] = n \cdot \cfrac{M}{N}
超幾何分布の分散
V[X]:Xの分散
V[X] = n \cdot
\cfrac{M}{N} \cdot
\left( 1 - \cfrac{M}{N} \right) \cdot
\cfrac{N - n}{N - 1}
例題
(「統計学実践ワークブック」より)
問5.2
A町に住む40歳代前半の男女から79人を無作為に選び、就業者と非就業者の数を集計したところ、次のようになった。
|
就業者 |
非就業者 |
計 |
男性 |
40 |
2 |
42 |
女性 |
26 |
11 |
37 |
計 |
66 |
13 |
79 |
表の79人から25人を無作為に選ぶとき、その25人のうち、男性で就業者の人数Xは長期化分布に従う。Xの確率関数P(X = x)を求めよ。
問5.3
ある9人のグループのうち3人は関東地方出身者、他の6人は関東地方以外の出身者であった。この9人の中から無作為非復元抽出によって選ばれた4人の標本をX_i \ (i = 1, 2, 3, 4)とおく。ただし、i番目の人が関東地方出身者のときX_i = 1、i番目の人が関東地方以外の出身者のときX_i = 0である。
[1] X_i^{2}の期待値E[X_i^{2}]を求めよ。
[2] X_i, X_j, i \neq jに対しE[X_i X_j]を求めよ。
[3] 標本平均\overline{X} = \cfrac{1}{4} \displaystyle\sum_{i = 1}^{4} X_iの分散V[\overline{X}]を求めよ。
解答
問5.2
題意より、Xは超幾何分布に従うため、確率関数pはHG(79, 40, 25)と表せる。したがって、P(X = x)は
\begin{alignat*}{2}
P(X = x) &= p(x) \\
&= \cfrac{{}_{40} C_{x} \cdot {}_{79 - 40} C_{25 - x}}{{}_{79} C_{25}} \\
&= \underline{
\cfrac{{}_{40} C_{x} \cdot {}_{39} C_{25 - x}}{{}_{79} C_{25}}
\hspace{5mm}
(0 \leqq x \leqq 25)
}
\end{alignat*}
問5.3
※この問は実は超幾何分布に関するものではありませんが、似ている(?)部分があります。是非何が似ていて何が違うのかを考えてみてはいかがでしょうか。
[1]
X_iの取りうる値は、題意より0と1であるから、求めるX_i^2の期待値E[X_i^2]は、
\begin{alignat*}{2}
E[X_i^2] &= 0^2 \cdot P(X_i = 0) + 1^2 \cdot P(X_i = 1) \\
&= P(X_i = 1)
\end{alignat*}
である。ただし、P(X_i)はX_iの確率である。よって、P(X_i = 1)の値を求めればよい。
ここで、X_i = 1となる確率とはつまり、「9人の中から無作為非復元抽出によって選ばれた4人のうち、i番目が(3人のうちの)関東地方出身者である確率」である。この確率は次のように考えることができる。
\cfrac{(3人のうちi番目の人を1人選んで並べる) \times (残った8人のうちから3人選んで並べる)}{i番目を固定せずに9人のうちから4人選んで並べる}
つまりは、i番目の人は必ず関東地方出身者でなければならないため、第一条件として先に考え、その後残った8人で3人の枠を埋めるという考え方である。
以上より、確率P(X_i = 1)は、
\begin{alignat*}{2}
P(X_i = 1) &= \cfrac{{}_{3} P_{1} \cdot {}_{9 - 1} P_{4 - 1}}{{}_{9} P_{4}} \\
&= \underline{\cfrac{ \ 1 \ }{3}}
\end{alignat*}
[2]
\begin{alignat*}{2}
E[X_i X_j] &= \sum_{x_i = 0}^{1} \sum_{x_j = 0}^{1}
x_i x_j P(X_i = x_i, X_j = x_j) \\
&= 0 \cdot 0 \cdot P(X_i = 0, X_j = 0) +
0 \cdot 1 \cdot P(X_i = 0, X_j = 1) +
1 \cdot 0 \cdot P(X_i = 1, X_j = 0) +
1 \cdot 1 \cdot P(X_i = 1, X_j = 1) \\
&= 1 \cdot 1 \cdot P(X_i = 1, X_j = 1) \\
&= \cfrac{{}_3 P_{2} \cdot {}_7 P_{2}}{{}_9 P_{4}} \\
&= \underline{\cfrac{ \ 1 \ }{12}}
\end{alignat*}
[3]
\begin{alignat*}{2}
V[\overline{X}] &= V \left[\cfrac{1}{4} \sum_{i = 1}^{4} X_i \right] \\
&= \cfrac{1}{16} V \left[\sum_{i = 1}^{4} X_i \right] \\
&= \cfrac{1}{16} \left(
\underline{
\sum_{i = 1}^{4} V[X_i] +
2 \sum_{i < j} Cov[X_i, X_j]
}
\right)
\text{※下の注意事項参照}
\end{alignat*}
ここで、V[X_i]、Cov[X_i, X_j]の値をそれぞれ求める。
V[X_i]について、
\begin{alignat*}{2}
V[X_i] &= E[X_{i}^{2}] - \left( E[X_i] \right)^2 \\
&= \cfrac{1}{3} - \cfrac{1}{9} \\
&= \cfrac{2}{9}
\end{alignat*}
Cov[X_i, X_j]について、
\begin{alignat*}{2}
Cov[X_i, X_j] &= E[X_i X_j] - E[X_i]E[X_j] \\
&= \cfrac{1}{12} - \cfrac{1}{3} \cdot \cfrac{1}{3} \\
&= - \cfrac{1}{36}
\end{alignat*}
以上より、
\begin{alignat*}{2}
V[\overline{X}] &= \cfrac{1}{16} \left(
\sum_{i = 1}^{4} V[X_i] +
2 \sum_{i < j} Cov[X_i, X_j]
\right) \\
&= \cfrac{1}{16} \left(
4 \cdot \cfrac{2}{9} +
2 \cdot 6 \cdot \left(
- \cfrac{1}{36}
\right)
\right) \\
&= \cfrac{1}{16} \left(
\cfrac{8}{9} - \cfrac{1}{3}
\right) \\
&= \cfrac{1}{16} \cdot \cfrac{5}{9} \\
&= \underline{\cfrac{5}{ \ 144 \ }}
\end{alignat*}
参考資料
\bf{\textcolor{red}{記事が役に立った方は「いいね」を押していただけると、すごく喜びます \ 笑}}
ご協力のほどよろしくお願いします。
Discussion