🐢

【統計学】負の二項分布

に公開

負の二項分布(Negative Binomial Distribution)

幾何分布を一般化した分布。

幾何分布

成功確率pの独立なベルヌーイ試行を繰り返すとき、はじめて成功するまでに失敗した回数が従う分布。
幾何分布の詳細は以下の記事を参照。
https://zenn.dev/pipipiz/articles/6ad73ac66fa81f

負の二項分布

成功確率pの独立なベルヌーイ試行を繰り返すとき、r回目に成功するまでに失敗した回数が従う分布。(幾何分布(r=1)の一般化。)

Y~NB(r,p)と表す。

1. 確率関数

r回目に成功するまでに失敗した回数をYとする。Y=yのとき、試行の回数は(r+y)回。
r+y回目は成功で、r+y-1回目までの間にr-1回成功、y回失敗するので、確率変数は

P(Y=y)=\frac{(y+r-1)!}{(r-1)!y!}p^r(1-p)^y\quad(y=0,1,2,\cdots)

一般二項係数を用いて表すと
P(Y=y)={}_{y+r-1}C_yp^r(1-p)^y=\binom{y+r-1}{y}p^r(1-p)^y\quad(y=0,1,2,\cdots)

一般二項係数

一般二項係数

自然数に限らず、任意の実数や複素数に対しても定義される二項係数のこと。

\binom{r}{k}=\begin{equation*}\left\{\begin{align*}&\frac{r(r-1)\cdots(r-k+1)}{k!}\quad(k=1,2,\cdots)\\&1\quad(k=0)\\&0\quad(k=-1,-2,\cdots)\end{align*}\right.\end{equation*}

rが自然数(n)で0\le k\le rのとき、二項係数と一致する。

二項係数

二項係数

異なるn個のものからk個を選ぶ組合せの数。

{}_nC_k=\frac{n!}{k!(n-k)!}

確率関数の和が1になることの証明
(1-x)^{-n}=\Sigma_{k=0}^{\infty}\binom{k+n-1}{k}x^k\cdots(1)

k=y,x=1-p,n=rを代入すると

p^{-r}=\Sigma_{y=0}^{\infty}\binom{y+r-1}{r}(1-p)^y

両辺にp^rを掛けると
1=\Sigma_{y=0}^{\infty}\binom{y+r-1}{r}p^r(1-p)^y

右辺はNB(r,p)の取りうるすべてのyについての和。

(1)式の説明

関数f(x)x=aにおけるテイラー展開は

\begin{align*}&f(x)=\Sigma_{k=0}^{\infty}\frac{f^{(k)}(a)}{k!}(x-a)^k\\&=f(a)+f^{(1)}(a)(x-a)+\frac{f^{(2)}(a)}{2!}(x-a)^2+\cdots\end{align*}

ここでf^{(k)}(a)f(x)k回微分してxaを代入した値。
特にa=0のときのテイラー展開をマクローリン展開という。

  • f(x)=(1-x)^{-n}のマクローリン展開は
    \begin{align*}&f^{(1)}(x)=-n(1-x)^{-n-1}(-1)=n(1-x)^{-n-1}\\&f^{(2)}(x)=n(n+1)(1-x)^{-n-2}\\&\cdots\\&f^{(k)}(x)=n(n+1)\cdots(n+k-1)(1-x)^{-n-k}\end{align*}

    f(x)k回微分した式にa=0
    f^{(k)}(0)=n(n+1)\cdots(n+k-1)

    よって、f(x)のマクローリン展開は
    \begin{align*}&f(x)=\Sigma_{k=0}^{\infty}\frac{f^{(k)}(0)}{k!}x^k\\&=\Sigma_{k=0}^{\infty}\frac{n(n+1)\cdots(n+k-1)}{k!}x^k\\&=\Sigma_{k=0}^{\infty}\binom{n+k-1}{k}x^k\end{align*}

    したがって
    f(x)=(1-x)^{-n}=\Sigma_{k=0}^{\infty}\binom{n+k-1}{k}x^k

2. 期待値と分散

幾何分布との関係

X_1,X_2,\cdots,X_r~Geo(p)かつ独立のとき、Y=X_1+X_2+\cdots+X_r~NB(r,p)

幾何分布と負の二項分布の関係の証明

Y_r=X_1+X_2+\cdots+X_rの確率関数がNB(r,p)の確率関数であると仮定する。
このときY_{r+1}=X_1+X_2+\cdots+X_r+X_{r+1}の確率関数がNB(r+1,p)の確率関数であることを示す。
Y_{r+1}=yとなるのは、(Y_r=0,X_{r+1}=y),(Y_r=1,X_{r+1}=y-1),\cdots,(Y_r=y,X_{r+1}=0)y+1通り。
よって、Y_{r+1}=yとなる確率は、

P(Y_{r+1}=y)=\Sigma_{k=0}^yP(Y_r=k,X_{r+1}=y-k)

Y_rX_{r+1}は独立なので、
=\Sigma_{k=0}^yP(Y_r=k)\Sigma_{k=0}^yP(X_{r+1}=y-k)

ここで、P(Y_r=k)r回成功するまでに失敗する回数Y_rk回となる確率だから
P(Y_r=k)={}_{r+k-1}C_{k}p^r(1-p)^k

また、P(X_{r+1}=y-k)ははじめて成功するまでにy-k回失敗する確率だから
P(X_{r+1}=y-k)=p(1-p)^{y-k}

よって
\begin{align*}P(Y_{r+1}=y)&=\Sigma_{k=0}^y{}_{r+k-1}C_{k}p^r(1-p)^k\Sigma_{k=0}^yp(1-p)^{y-k}\\&=p^{r+1}(1-p)^y\Sigma_{k=0}^y{}_{r+k-1}C_k\end{align*}

ここで
\Sigma_{k=0}^y{}_{r+k-1}C_k={}_{y+r}C_y\cdots(2)
なので
P(Y_{r+1}=y)={}_{y+r}C_yp^{r+1}(1-p)^y

右辺はNB(r+1,p)の確率関数。
また、Y_1=X_1の確率関数はNB(1,p)の確率関数と一致する。
よって帰納法により示された。

(2)式の証明
\Sigma_{k=0}^y{}_{r+k-1}C_k={}_{y+r}C_y\cdots(2)

自然数rが固定されているとする。

  1. y=1のとき
    \sum\limits_{k=0}^1{}_{k+r-1}C_k={}_{r-1}C_0+{}_{r}C_1=1+r

    また、
    {}_{1+r}C_1=1+r
    より(2)式は成り立つ。
  2. (2)式を仮定し、\sum\limits_{k=0}^{y+1}{}_{r+k-1}C_k={}_{y+1+r}C_{y+1}を示す。
    \begin{align*}\sum\limits_{k=0}^{y+1}{}_{r+k-1}C_k&=\sum\limits_{k=0}^{y}{}_{r+k-1}C_k+{}_{r+y}C_{y+1}\\&={}_{y+r}C_y+{}_{r+y}C_{y+1}\\&=\frac{(y+r)!}{y!r!}+\frac{(r+y)!}{(y+1)!(r-1)!}\\&=\frac{(y+r)!(y+1)}{(y+1)!r!}+\frac{(y+r)!r}{(y+1)!r!}\\&=\frac{(y+r)!(y+1+r)}{(y+1)!r!}\\&=\frac{(y+1+r)!}{(y+1)!r!}={}_{y+1+r}C_{y+1}\end{align*}

    よって帰納法により示された。
  • 期待値:
    \begin{align*}&E[Y]=E[X_1+X_2+\cdots+X_r]\\&=E[X_1]+E[X_2]+\cdots+E[X_r]\\&=\frac{r(1-p)}{p}\end{align*}
  • 分散:
    V[Y]=V[X_1+X_2+\cdots+X_r]

    X_1,X_2,\cdots,X_kは独立より、
    \begin{align*}&=V[X_1]+V[X_2]+\cdots+V[X_r]\\&=\frac{r(1-p)}{p^2}\end{align*}

Discussion