負の二項分布(Negative Binomial Distribution)
幾何分布を一般化した分布。
幾何分布
成功確率pの独立なベルヌーイ試行を繰り返すとき、はじめて成功するまでに失敗した回数が従う分布。
幾何分布の詳細は以下の記事を参照。
https://zenn.dev/pipipiz/articles/6ad73ac66fa81f
負の二項分布
成功確率pの独立なベルヌーイ試行を繰り返すとき、r回目に成功するまでに失敗した回数が従う分布。(幾何分布(r=1)の一般化。)
Y~NB(r,p)と表す。
1. 確率関数
r回目に成功するまでに失敗した回数をYとする。Y=yのとき、試行の回数は(r+y)回。
r+y回目は成功で、r+y-1回目までの間にr-1回成功、y回失敗するので、確率変数は
P(Y=y)=\frac{(y+r-1)!}{(r-1)!y!}p^r(1-p)^y\quad(y=0,1,2,\cdots)
一般二項係数を用いて表すと
P(Y=y)={}_{y+r-1}C_yp^r(1-p)^y=\binom{y+r-1}{y}p^r(1-p)^y\quad(y=0,1,2,\cdots)
一般二項係数
一般二項係数
自然数に限らず、任意の実数や複素数に対しても定義される二項係数のこと。
\binom{r}{k}=\begin{equation*}\left\{\begin{align*}&\frac{r(r-1)\cdots(r-k+1)}{k!}\quad(k=1,2,\cdots)\\&1\quad(k=0)\\&0\quad(k=-1,-2,\cdots)\end{align*}\right.\end{equation*}
rが自然数(
n)で
0\le k\le rのとき、二項係数と一致する。
二項係数
二項係数
異なるn個のものからk個を選ぶ組合せの数。
{}_nC_k=\frac{n!}{k!(n-k)!}
確率関数の和が1になることの証明
(1-x)^{-n}=\Sigma_{k=0}^{\infty}\binom{k+n-1}{k}x^k\cdots(1)
にk=y,x=1-p,n=rを代入すると
p^{-r}=\Sigma_{y=0}^{\infty}\binom{y+r-1}{r}(1-p)^y
両辺に
p^rを掛けると
1=\Sigma_{y=0}^{\infty}\binom{y+r-1}{r}p^r(1-p)^y
右辺は
NB(r,p)の取りうるすべての
yについての和。
(1)式の説明
関数f(x)のx=aにおけるテイラー展開は
\begin{align*}&f(x)=\Sigma_{k=0}^{\infty}\frac{f^{(k)}(a)}{k!}(x-a)^k\\&=f(a)+f^{(1)}(a)(x-a)+\frac{f^{(2)}(a)}{2!}(x-a)^2+\cdots\end{align*}
ここで
f^{(k)}(a)は
f(x)を
k回微分して
xに
aを代入した値。
特に
a=0のときのテイラー展開をマクローリン展開という。
-
f(x)=(1-x)^{-n}のマクローリン展開は
\begin{align*}&f^{(1)}(x)=-n(1-x)^{-n-1}(-1)=n(1-x)^{-n-1}\\&f^{(2)}(x)=n(n+1)(1-x)^{-n-2}\\&\cdots\\&f^{(k)}(x)=n(n+1)\cdots(n+k-1)(1-x)^{-n-k}\end{align*}
f(x)をk回微分した式にa=0は
f^{(k)}(0)=n(n+1)\cdots(n+k-1)
よって、f(x)のマクローリン展開は
\begin{align*}&f(x)=\Sigma_{k=0}^{\infty}\frac{f^{(k)}(0)}{k!}x^k\\&=\Sigma_{k=0}^{\infty}\frac{n(n+1)\cdots(n+k-1)}{k!}x^k\\&=\Sigma_{k=0}^{\infty}\binom{n+k-1}{k}x^k\end{align*}
したがってf(x)=(1-x)^{-n}=\Sigma_{k=0}^{\infty}\binom{n+k-1}{k}x^k
2. 期待値と分散
幾何分布との関係
X_1,X_2,\cdots,X_r~Geo(p)かつ独立のとき、Y=X_1+X_2+\cdots+X_r~NB(r,p)
幾何分布と負の二項分布の関係の証明
Y_r=X_1+X_2+\cdots+X_rの確率関数がNB(r,p)の確率関数であると仮定する。
このときY_{r+1}=X_1+X_2+\cdots+X_r+X_{r+1}の確率関数がNB(r+1,p)の確率関数であることを示す。
Y_{r+1}=yとなるのは、(Y_r=0,X_{r+1}=y),(Y_r=1,X_{r+1}=y-1),\cdots,(Y_r=y,X_{r+1}=0)のy+1通り。
よって、Y_{r+1}=yとなる確率は、
P(Y_{r+1}=y)=\Sigma_{k=0}^yP(Y_r=k,X_{r+1}=y-k)
Y_rと
X_{r+1}は独立なので、
=\Sigma_{k=0}^yP(Y_r=k)\Sigma_{k=0}^yP(X_{r+1}=y-k)
ここで、
P(Y_r=k)は
r回成功するまでに失敗する回数
Y_rが
k回となる確率だから
P(Y_r=k)={}_{r+k-1}C_{k}p^r(1-p)^k
また、
P(X_{r+1}=y-k)ははじめて成功するまでに
y-k回失敗する確率だから
P(X_{r+1}=y-k)=p(1-p)^{y-k}
よって
\begin{align*}P(Y_{r+1}=y)&=\Sigma_{k=0}^y{}_{r+k-1}C_{k}p^r(1-p)^k\Sigma_{k=0}^yp(1-p)^{y-k}\\&=p^{r+1}(1-p)^y\Sigma_{k=0}^y{}_{r+k-1}C_k\end{align*}
ここで
\Sigma_{k=0}^y{}_{r+k-1}C_k={}_{y+r}C_y\cdots(2)なので
P(Y_{r+1}=y)={}_{y+r}C_yp^{r+1}(1-p)^y
右辺は
NB(r+1,p)の確率関数。
また、
Y_1=X_1の確率関数は
NB(1,p)の確率関数と一致する。
よって帰納法により示された。
(2)式の証明
\Sigma_{k=0}^y{}_{r+k-1}C_k={}_{y+r}C_y\cdots(2)
自然数rが固定されているとする。
-
y=1のとき
\sum\limits_{k=0}^1{}_{k+r-1}C_k={}_{r-1}C_0+{}_{r}C_1=1+r
また、
{}_{1+r}C_1=1+r
より(2)式は成り立つ。
- (2)式を仮定し、\sum\limits_{k=0}^{y+1}{}_{r+k-1}C_k={}_{y+1+r}C_{y+1}を示す。
\begin{align*}\sum\limits_{k=0}^{y+1}{}_{r+k-1}C_k&=\sum\limits_{k=0}^{y}{}_{r+k-1}C_k+{}_{r+y}C_{y+1}\\&={}_{y+r}C_y+{}_{r+y}C_{y+1}\\&=\frac{(y+r)!}{y!r!}+\frac{(r+y)!}{(y+1)!(r-1)!}\\&=\frac{(y+r)!(y+1)}{(y+1)!r!}+\frac{(y+r)!r}{(y+1)!r!}\\&=\frac{(y+r)!(y+1+r)}{(y+1)!r!}\\&=\frac{(y+1+r)!}{(y+1)!r!}={}_{y+1+r}C_{y+1}\end{align*}
よって帰納法により示された。
- 期待値:\begin{align*}&E[Y]=E[X_1+X_2+\cdots+X_r]\\&=E[X_1]+E[X_2]+\cdots+E[X_r]\\&=\frac{r(1-p)}{p}\end{align*}
- 分散:
V[Y]=V[X_1+X_2+\cdots+X_r]
X_1,X_2,\cdots,X_kは独立より、\begin{align*}&=V[X_1]+V[X_2]+\cdots+V[X_r]\\&=\frac{r(1-p)}{p^2}\end{align*}
Discussion