📊

【統計検定準1級】幾何分布

2024/07/24に公開

はじめに

この記事では、統計検定準1級取得に向けて学習したことをまとめていきます。
工学系の数学ではなく数理あるあるの、論述ゴリゴリな解答になっていると思いますのであらかじめご了承ください。
注意:さらに計算過程は数学文化の『省略の美』を無視してエレファントに書いています。

【リンク紹介】
統計検定準1級のまとめ記事一覧
これまで書いたシリーズ記事一覧

学習書籍について

この記事では「統計学実践ワークブック」を中心に、学んだことをまとめていきます。記事を読んで本格的に勉強してみたいなと思った方は、是非ご購入を検討なさってください。


参考書籍について

統計実践ワークブックは、大量の知識項目と問題が収められている反面、計算過程や知識背景が大きく省略されているため、知識体系をきちんと学ぶ参考書として東京大学から出版されている名著「統計学入門」を使っています。
※ワークブックとしては素晴らしい質だと思いますが、どうしてもその内容量とページ数の都合上、問題のない範囲で削除されているということです。人によっては1冊で問題ない方もおられると思いますが、私には無理でした。


幾何分布

定義は何を確率変数とするかで、2パターンあります。※本質的に大きな変化はありませんが、期待値が変わってしまうので要注意です。

定義1

ベルヌーイ試行において、\bf{はじめて成功の結果が起こるまでに、\textcolor{red}{起こった失敗の結果の数}}を、確率変数Xとする。このとき、Xの確率が

\begin{alignat*}{2} P(X = x) &= p (1 - p)^{x} \hspace{7mm} &(x = 0, 1, 2, \cdots) \\ \end{alignat*}

であるとき、この確率関数p (1 - p)^{x}を(成功確率pの)幾何分布(geometric distribution)といい、Geo(p)と表す。

定義2

ベルヌーイ試行において、\bf{はじめて成功の結果が起こるまでの、\textcolor{red}{行った試行回数}}を、確率変数Xとする。このとき、Xの確率が

\begin{alignat*}{2} P(X = x) &= p (1 - p)^{x - 1} \hspace{5mm} &(x = 1, 2, 3, \cdots)) \end{alignat*}

であるとき、この確率関数p (1 - p)^{x - 1}を(成功確率pの)幾何分布といい、Geo(p)と表す。
※つまりは成功結果の試行回数1回分を含んでいるため、失敗回数を表現するためにはその1回分を引いてあげないとダメということです。

幾何分布の期待値

定義1

X\bf{はじめて成功の結果が起こるまでに、\textcolor{red}{起こった失敗の結果の数}}
E[X]X期待値

\begin{alignat*}{2} E[X] &= \cfrac{1 - p}{p} \end{alignat*}

定義2

X\bf{はじめて成功の結果が起こるまでの、\textcolor{red}{行った試行回数}}
E[X]Xの期待値

\begin{alignat*}{2} E[X] &= \cfrac{ \ \ 1 \ \ }{p} \end{alignat*}

幾何分布の分散

V[X]X分散
分散は定義1、定義2共通となります。

V[X] = \cfrac{1 - p}{p^2}

幾何分布の確率母関数

G(s) = E[s^X]X確率母関数

\begin{alignat*}{2} G(s) &= E[s^X] \\ &= \cfrac{p}{1 - (1 - p)s}, \hspace{5mm} |s| < \cfrac{1}{1 - p} \end{alignat*}

例題

(「統計学実践ワークブック」より)
問5.5
あるお菓子を買うと、4種類のアニメキャラクターのカードのうちの1つが等確率でおまけとして付いてくる。
[1] 無作為復元抽出を仮定できるとき、4種類すべてのカードを揃えるまでに必要な購入回数の期待値を求めよ。
[2] 4種類のカードをすべて集めた後、お菓子を買うのをやめていたが、新しい種類のカード1枚が追加されたため再び購入をはじめた。この場合に、はじめの4種類と追加の1種類の、5種類すべてをそろえるのに必要な購入回数の期待値をxとする。一方、はじめから5種類が発売されていた場合に、5種類すべてを揃えるまでに必要な購入回数の期待値をyとする。購入回数の期待値の差x - yの値を求めよ。ただし、いずれの購入時期においても等確率の無作為復元抽出を仮定してよい。

解答

[1] 今、n種類中すでにk \ (0 \leqq k \leqq n - 1)種類のカードが揃っているとする。このときお菓子を買ってk + 1種類目のカードが出る確率p_k

p_k = \cfrac{n - k}{n} \hspace{5mm} \cdots ①

と表せる。ここで
k種類目のカードが揃った後、k + 1種類目のカードが出るまでに必要な購入回数」をxとすると、
k種類目のカードが揃った後、k + 1種類目のカードがx回目の購入で出る」確率は、

p_k (1 - p_k)^{x - 1}

である(\bf{\textcolor{red}{定義2}})。つまり、このx確率変数X_kとすると、X_kは(成功確率p_kの)幾何分布である(つまりGeo(p_k))。

よって、この期待値E[X_k]は、

\begin{alignat*}{2} E[X_k] &= \cfrac{1}{p_k} \\ &= \cfrac{n}{n - k} \hspace{5mm} \cdots ② \end{alignat*}

である。したがって、「n種類すべてのカードを揃えるまでに必要な購入回数の期待値」は

\begin{alignat*}{2} E \left[ \sum_{k = 0}^{n - 1} X_k \right] &= \sum_{k = 0}^{n - 1} E[X_k] \\ &= \sum_{k = 0}^{n - 1} \cfrac{n}{n - k} \hspace{5mm} \cdots ③ \\ \end{alignat*}

と表せる。ここで、題意よりn = 4であるから、

\begin{alignat*}{2} E \left[ \sum_{k = 0}^{3} X_k \right] &= \sum_{k = 0}^{3} E[X_k] \\ &= \sum_{k = 0}^{3} \cfrac{4}{4 - k} \\ &= \cfrac{4}{4} + \cfrac{4}{3} + \cfrac{4}{2} + \cfrac{4}{1} \\ &= \cfrac{4}{4} + \cfrac{4}{3} + \cfrac{4}{2} + \cfrac{4}{1} \\ &= 4 \cdot \cfrac{ 3 \cdot 2 \cdot 1 + 4 \cdot 2 \cdot 1 + 4 \cdot 3 \cdot 1 + 4 \cdot 3 \cdot 2 } {4 \cdot 3 \cdot 2 \cdot 1} \\ &= \cfrac{3 + 4 + 6 + 12}{3} \\ &= \underline{\cfrac{ \ 25 \ }{3}} \\ \end{alignat*}

[2] まず期待値xについて考える。
「4種類のカードが揃っているとき、5種類目のカードが出る確率は、[1]の①より

\begin{alignat*}{2} p_4 &= \cfrac{5 - 4}{5} \\ &= \cfrac{1}{5} \end{alignat*}

である。よってこの時の期待値は、[1]の②より

\begin{alignat*}{2} E[X_4] &= \cfrac{5}{5 - 4} \\ &= 5 \hspace{5mm} \cdots ④ \end{alignat*}

である。したがって、期待値xは、[1]で求めた値に④を足せばよいので、

\begin{alignat*}{2} x &= E \left[ \sum_{k = 0}^{3} X_k \right] + E[X_4] \\ &= \cfrac{25}{3} + 5 \\ &= \cfrac{ \ 40 \ }{3} \end{alignat*}

次に期待値yについて考える。これは[1]の③の式において、n = 5を適用すれば求めることができる。よって、

\begin{alignat*}{2} y &= E \left[ \sum_{k = 0}^{4} X_k \right] \\ &= \sum_{k = 0}^{4} \cfrac{5}{5 - k} \\ &= \cfrac{5}{5} + \cfrac{5}{4} + \cfrac{5}{3} + \cfrac{5}{2} + \cfrac{5}{1} \\ & (計算過程省略) \\ &= \cfrac{137}{12} \end{alignat*}

以上より、

\begin{alignat*}{2} x - y &= \cfrac{ \ 40 \ }{3} - \cfrac{137}{12} \\ &= \cfrac{160 - 137}{12} \\ &= \underline{\cfrac{ \ 23 \ }{12}} \\ \end{alignat*}

参考資料

\bf{\textcolor{red}{記事が役に立った方は「いいね」を押していただけると、すごく喜びます \ 笑}}
ご協力のほどよろしくお願いします。

Discussion