ポアソン分布のもっとも本質的な説明です。指数分布との関係についても言及しています。
ポアソン分布
ポアソン分布について知るためにまずは二項分布の復習をします。
二項分布では離散の試行だったものをポアソン分布では連続の試行に変換します。この意味が分かる人はポアソン分布の話は飛ばしてもらって大丈夫です。
二項分布
二項分布は歪んだコインをn回投げたときに表が出る回数kが従う確率分布です。
1回投げたときに表が出る確率をpとします。n回投げたとき表がk回出る確率P(X=k)は以下です。
P(X=k) = {}_n \mathrm{C}_k p^k(1-p)^{n-k}
この分布の平均E[X], V[X]はそれぞれ以下の通りです。
\begin{aligned}
E[X]&=np\\
V[X]&=np(1-p)
\end{aligned}
一応導出しておきますが飛ばしてもらって大丈夫です。
二項分布の平均と分散
確率母関数をG(s)とすると
\begin{aligned}
G(s) &= E[s^X]\\
&=\sum_{k=0}^{\infty} s^k{}_n \mathrm{C}_k p^k(1-p)^{n-k}\\
&=\sum_{k=0}^{\infty} {}_n \mathrm{C}_k (sp)^k(1-p)^{n-k}\\
&=\{1+(s-1)p\}^n
\end{aligned}
よって平均と分散は
\begin{aligned}
&E[X]=G^{'}(1)=np\{1+(s-1)p\}^{n-1}|_{s=1}=np\\
&E[X(X-1)]=G^{"}(1)=n(n-1)p^2\{1+(s-1)p\}^{n-2}|_{s=1}=n(n-1)p^2\\
&V[X]=E[X(X-1)]+E[X]-E[X]^2=n(n-1)p^2+np-(np)^2=np(1-p)
\end{aligned}
ポアソン分布は二項分布の極限とよく言われます。実際, ポアソン分布は二項分布において平均E[X]=np=\lambdaを一定としてn\rightarrow\inftyとすることで得られます。
ポアソン分布の導出
\begin{aligned}
P(X=k) & =\lim _{n \rightarrow \infty} n C_k p^k(1-p)^{n-k} \\
& =\lim _{n \rightarrow \infty} \frac{n(n-1) \cdot(n-k+1)}{k !}\left(\frac{\lambda}{n}\right)^k\left(1-\frac{\lambda}{n}\right)^{n-k} \\
& =\frac{\lambda^k}{k !} \lim _{n \rightarrow \infty} 1 \cdot\left(1-\frac{1}{n}\right) \cdots\left(1-\frac{k-1}{n}\right) \cdot\left(1-\frac{\lambda}{n}\right)^{-k}\left(1-\frac{\lambda}{n}\right)^{\left(-\frac{n}{\lambda}\right) \cdot (-\lambda)} \\
& =\frac{\lambda^k}{k !} \lim _{n \rightarrow \infty}\left(1-\frac{\lambda}{n}\right)^{\left(-\frac{n}{\lambda}\right) \cdot (-\lambda)}\\
&=\frac{\lambda^k}{k !} e^{-\lambda}
\end{aligned}
nを無限大に飛ばすのがどういうことかを考えます。これは1回のコイン投げを無限回行うというよりは 1回のコイン投げを無限回に分割するというほうが正しいと思います(結局無限回投げてますが)。二項分布では1秒に1回コインを投げる試行をn秒間行っていたとすると, ポアソン分布では0.0000\cdots秒に1回コインを投げるという試行を1秒経つまで行うということです。実際グラフを検索すればわかりますが, 2項分布のグラフの横軸はn回の試行に対する発生回数でありポアソングラフの横軸は単位時間当たりの発生回数になっているはずです。
\quad
二項分布では1秒後には0 or 1ですが, ポアソン分布では無限回試行を行っているので発生回数の分布が生まれます。二項分布では離散の試行だったものを連続の試行に変換したということです。無限回行った結果, 何回発生したかが横軸になるので, 試行は連続ですがポアソン分布は離散分布である事に注意です。
指数分布
指数分布は単位時間当たりの発生回数が\lambda回の事象が起こる間隔xの分布です。つまりポアソン分布で無限回に細かく試行を行う中で1回事象が発生した後に次にまた事象が発生するまでの間隔の確率分布です。ポアソン分布は事象の発生回数の分布なので離散分布でしたが, 指数分布は事象の発生間隔の分布でありポアソン分布では試行は連続だったので指数分布も連続分布になります。その確率密度関数f(x)は次の条件を満たす必要があります。このxは次に事象が起こるまでの間隔です。
f(x)dx = \left(1-\int_{0}^{x}f(x)dx\right)\lambda dx
両辺ともに1回事象が起きてからx経過後のdxの間に次の事象が起きる確率を表しています。
右辺の第1項はx経過するまで次の事象が発生しない確率を, 第2項はx経過後の次のdxの間に事象が発生する確率を表しています。
この積分方程式を解けば次の式が得られます。
f(x) = \lambda e^{-\lambda x}
Discussion