はじめに
この記事では、統計検定準1級取得に向けて学習したことをまとめていきます。
工学系の数学ではなく数理あるあるの、論述ゴリゴリな解答になっていると思いますのであらかじめご了承ください。
注意:さらに計算過程は数学文化の『省略の美』を無視してエレファントに書いています。
【リンク紹介】
・統計検定準1級のまとめ記事一覧
・これまで書いたシリーズ記事一覧
学習書籍について
この記事では「統計学実践ワークブック」を中心に、学んだことをまとめていきます。記事を読んで本格的に勉強してみたいなと思った方は、是非ご購入を検討なさってください。
参考書籍について
統計実践ワークブックは、大量の知識項目と問題が収められている反面、計算過程や知識背景が大きく省略されているため、知識体系をきちんと学ぶ参考書として東京大学から出版されている名著「統計学入門」を使っています。
※ワークブックとしては素晴らしい質だと思いますが、どうしてもその内容量とページ数の都合上、問題のない範囲で削除されているということです。人によっては1冊で問題ない方もおられると思いますが、私には無理でした。
二項分布
ベルヌーイ試行において、成功の結果が起こる確率をpとする。そしてn回の試行中に成功の結果が起こる回数を確率変数Xとする。このとき、Xの確率が
\begin{alignat*}{2}
P(X = x) &= {}_n C_x p^x (1 - p)^{n - x} \hspace{5mm} (x = 0, 1, 2, \cdots, n)
\end{alignat*}
であるとき、この確率関数{}_n C_x p^x (1 - p)^{n - x}を(成功確率pの)二項分布(binomial distribution)といい、Bin(n, p)と表す。ただし、
{}_n C_x= \cfrac{n!}{x! \times (n - x)!},
\hspace{5mm}{}_n C_0 = 1 \\
r! = r \times (r - 1) \times \cdots \times 2 \times 1,
\hspace{5mm}0! = 1
とする。
二項分布の期待値
E[X]:Xの期待値
二項分布の分散
V[X]:Xの分散
二項分布の確率母関数
G(s) = E[s^X]:Xの確率母関数
\begin{alignat*}{2}
G(s) &= E[s^X] \\
&= (ps + (1 - p))^n
\end{alignat*}
例題
(「統計学実践ワークブック」より)
問5.1
ある研究機関では、ウイルスに関する研究を行っている。多くのウイルスを検査し、滅多に現れないウイルスAを発見し、その性質を研究するのがこの期間の仕事である。検査するウイルスの全株数をnとする。n株のウイルスの検査は独立に行われ、いずれの検査においても、ウイルスAの発見率は一定値pであるとする。
[1] n株のウイルスの中にウイルスAが少なくとも1株はみつかる確率\betaを求める式を、pとnを用いて示せ。
[2] pの値が0に十分近いとき、\log (1 - p) \approx -pの近似が成り立つ。これを用いて、p = 1/5000, \beta = 0.98のときのnの値を求めよ。ただし、\log (0.02) \approx - 3.9であり、\logは自然対数である。
解答
[1] 確率変数Xを、ウイルスAが見つかる株の数とする(0 \leqq X \leqq n)。すると、Xの確率P(X)(n株のウイルスからウイルスAの株がX株見つかる確率)は以下のようになる。
P(X) = {}_n C_{x} p^x (1 - p)^{n - x}
これはXの二項分布である(つまりBin(n, p))。
さて、求める\betaについて、これは「n株のウイルスの中にウイルスAが少なくとも1株は見つかる確率」であるので、
\begin{alignat*}{2}
\beta &= P(X \geqq 1) \\
&= 1 - P(X = 0) \\
&= 1 - {}_n C_0 p^0 (1 - p)^{n - 0} \\
&= 1 - 1 \times 1 \times (1 - p)^n \\
&= \underline{1 - (1 - p)^n}
\end{alignat*}
[2] p = \cfrac{1}{5000}, \beta = 0.98と[1]より
\begin{alignat*}{2}
\beta &= 1 - (1 - p)^n \\
0.98 &= 1 - (1 - \cfrac{1}{5000})^n \\
(1 - \cfrac{1}{5000})^n &= 0.02 \\
\log (1 - \cfrac{1}{5000})^n &= \log 0.02 \\
n &= \cfrac{\log 0.02}{\log (1 - \cfrac{1}{5000})}
\end{alignat*}
ここで、
\log (0.02) \approx - 3.9 \\
\log (1 - \cfrac{1}{5000}) \approx - \cfrac{1}{5000}
であるから、
\begin{alignat*}{2}
n &\approx \cfrac{ \ \ 3.9 \ \ }{\frac{1}{5000}} \\
n &\approx \underline{19500}
\end{alignat*}
参考資料
\bf{\textcolor{red}{記事が役に立った方は「いいね」を押していただけると、すごく喜びます \ 笑}}
ご協力のほどよろしくお願いします。
Discussion