🐢

【統計学】ポアソン分布

に公開

ポアソン分布(Poisson distribution)

単位時間に平均\lambda回起こる現象が、ある一定期間に起きる回数Xが従う分布。
X~Po(\lambda)と表す。

0.いつ使うか

1. 二項分布のポアソン近似

試行の数nが大きく、成功確率pが非常に小さい二項分布はポアソン分布で近似できる。(nが大きいと二項分布の計算は大変なので、近似を利用する。)

2. ポアソン過程

連続した時間的(または空間的)区間の上で観測値がとられ、以下の3つの仮定:

  1. 互いに重なり合っていない時間間隔のそれぞれである事象の起こる回数が独立
  2. 小さい時間間隔において事象が1回起こる確率がほぼその間隔の幅に比例する
  3. 小さい時間間隔において事象が2回以上起こる確率はその区間で事象が1回起こる確率に比べて無視できるほど小さい

が満たされたとき、長さが一定のある時間間隔(または空間間隔)内で事象が起こる回数Xの分布はポアソン分布に従う。(また、このような実験をポアソン過程と呼ぶ。)

  • 例:一定時間内にある電話番号にかかってくる電話の数、1枚の金属板のきずの数

1. 確率関数

単位時間(または空間)内に事象が起こる確率を\lambdaとすると、確率関数は

f(x)=\frac{e^{-\lambda}\lambda^x}{x!}

ポアソン分布の確率関数の導出

二項分布X~Bin(n,p)の確率関数にnp=\lambdaより、p=\frac{\lambda}{n}を代入すると

\frac{n!}{x!(n-x)!}p^x(1-p)^{n-x}=\frac{n!}{x!(n-x)!}\left(\frac{\lambda}{n}\right)^x\left(1-\frac{\lambda}{n}\right)^{(n-x)}

  • 右辺の前半部分
    \frac{n!}{x!(n-x)!}\left(\frac{\lambda}{n}\right)^x=\frac{n!}{x!(n-x)!}\frac{\lambda^x}{n^x}=\frac{\lambda^x}{x!}\frac{n!}{(n-x)!n^x}
  • 右辺の後半部分
    \left(1-\frac{\lambda}{n}\right)^{(n-x)}=\left(1-\frac{\lambda}{n}\right)^n\left(1-\frac{\lambda}{n}\right)^{-x}

    よって元の式
    \frac{n!}{x!(n-x)!}p^x(1-p)^{n-x}=\frac{\lambda^x}{x!}\frac{n!}{(n-x)!n^x}\left(1-\frac{\lambda}{n}\right)^n\left(1-\frac{\lambda}{n}\right)^{-x}
  • 右辺の2番目の部分のn\to \inftyの極限:
    \begin{align*}&\lim_{n\to\infty}\frac{n!}{(n-x)!n^x}=\lim_{n\to \infty}\frac{n(n-1)(n-2)\cdots(n-x-1)}{n^x}\\&=\lim_{n\to \infty}1\cdot\left(1-\frac{1}{n}\right)\cdot\left(1-\frac{2}{n}\right)\cdot\cdots\cdot\left(1-\frac{x-1}{n}\right)=1\end{align*}
  • 右辺の4番目の部分のn\to\inftyの極限:
    \lim_{n\to\infty}\left(1-\frac{\lambda}{n}\right)^{-x}=1
  • 右辺の3番目の部分:
    \left(1-\frac{\lambda}{n}\right)^n=\left[\left(1-\frac{\lambda}{n}\right)^{-\frac{n}{\lambda}}\right]^{-\lambda}
    • ここで
      e=\lim_{n\to\infty}\left(1+\frac{1}{n}\right)^n
      x=\frac{1}{n}とおくとn\to\inftyx\to0より
      e=\lim_{x\to0}(1+x)^{\frac{1}{x}}
      x=-\frac{\lambda}{n}を代入すると
      =\lim_{-\frac{\lambda}{n}\to0}\left(1-\frac{\lambda}{n}\right)^{\frac{n}{\lambda}}
    • よって
      \lim_{n\to\infty}\left(1-\frac{\lambda}{n}\right)^n=\lim_{n\to\infty}\left[\left(1-\frac{\lambda}{n}\right)^{-\frac{n}{\lambda}}\right]^{-\lambda}=e^{-\lambda}

      したがって
      \lim{n\to\infty}\frac{n!}{x!(n-x)!}p^x(1-p)^{n-x}=\frac{\lambda^x}{x!}e^{-\lambda}=\frac{e^{-\lambda}\cdot\lambda^x}{x!}
確率関数の和が1になる証明

\Sigma_xf(x)=\Sigma_x\frac{e^{-\lambda x^{\lambda}}}{x!}=1の証明
eを底とする指数関数のべき級数表示

e^x=1+x+\frac{x^2}{2!}+\frac{x^3}{3!}+\cdots

x=\lambdaを代入すると
e^{\lambda}=1+\lambda+\frac{\lambda^2}{2!}+\frac{\lambda^3}{3!}+\cdots

両辺にe^{-\lambda}を掛けると
1=e^{-\lambda}+e^{-\lambda}\cdot\lambda+\frac{e^{-\lambda}\cdot\lambda^2}{2!}+\frac{e^{-\lambda}\cdot\lambda^3}{3!}+\cdots

2.期待値と分散

二項分布X~Bin(n,p)np=\lambdaを固定したままn\to\inftyの極限をとったものがポアソン分布Po(\lambda)
このため、二項分布の期待値と分散をnp=\lambdaを固定したままn\to\inftyの極限をとることでポアソン分布の期待値と分散が得られる。

  • 期待値:二項分布の期待値より、ポアソン分布の期待値は
    \begin{align*}&E[X]=np\\&=\lambda\end{align*}
  • 分散:二項分布の分散は
    V[X]=np(1-p)
    ここでnpを一定(=\lambda)にしたままn\to\inftyの極限をとるとp\to0より(1-p)\to1よってポアソン分布の分散は
    V[X]=np=\lambda

3. 性質

1. 再生性

X~Po(\lambda_1),Y~Po(\lambda_2)XYが独立ならばX+Y~Po(\lambda_1+\lambda_2)

再生性の証明
P(X+Y=n)=\Sigma_{k=0}^nP(X=k, Y=n-k)

ここで、XYが独立ならば

\begin{align*}&=\Sigma_{k=0}^nP(X=k)P(Y=n-k)\\&=\Sigma_{k=1}^n\frac{e^{-\lambda_1}\lambda_1^k}{k!}\frac{e^{-\lambda_2}\lambda_2^{(n-k)}}{(n-k)!}\\&=\frac{e^{-(\lambda_1+\lambda_2)}}{n!}\Sigma_{k=0}^n\frac{n!}{k!(n-k)!}\lambda_1^k\lambda_2^{(n-k)}\end{align*}

二項定理より、
\Sigma_{k=0}^n\frac{n!}{k!(n-k)!}\lambda_1^k\lambda_2^{(n-k)}=(\lambda_1+\lambda_2)^n
だから
=\frac{e^{-(\lambda_1+\lambda_2)}\cdot(\lambda_1+\lambda_2)^n}{n!}

~Po(\lambda_1+\lambda_2)

脚注
  1. P.G.ホーエル 入門数理統計学(p.64) ↩︎

Discussion