確率密度関数
ガンマ分布の確率密度関数は以下で表される
f(x∣α,β)=βαΓ(α)1xα−1e−βxif0<x,f(x∣α,β)=0otherwiseWhere,Γ(α)=∫0∞xα−1e−xdx,0<α
可視化
01: αを変化させたときのガンマ分布

02: βを変化させたときのガンマ分布


画像を生成するコード
Gamma関数の公式
Γ(⋅) だが, 以下の特徴がある.
Γ(α)=∫0∞tα−1e−tdt
等式
ガンマ関数について以下が成り立つ.
Γ(α)=(α−1)Γ(α)
証明
Γ(α)=∫0∞tα−1e−tdt=∫0∞tα−1{dtd−e−t}dt=[−tα−1e−t]0∞+(α−1)∫0∞tα−2e−tdt=(0−0)+(α−1)Γ(α−1)
期待値・分散
期待値・分散は定義からパラメータが元の式とは異なる確率密度関数の積分と定数係数に分けて導出する.
期待値の導出
E(X)=∫0∞xfX(x)dx=∫0∞xΓ(α)−1β−1(βx)α−1e−βxdx=Γ(α)−1β−1∫0∞ββx(βx)α−1e−βxdx=Γ(α)−1β−1β∫0∞βx(βx)α−1e−βxdx=Γ(α)−1∫0∞(βx)(α+1)−1e−βxdx=Γ(α)−1Γ(α+1)β∫0∞Γ(α+1)−1β−1(βx)(α+1)−1e−βxdx=Γ(α)−1αΓ(α)β=αβ
分散の導出
E(X2)=∫0∞x2fX(x)dx=∫0∞x2Γ(α)−1β−1(βx)α−1e−βxdx=Γ(α)−1β−1∫0∞β2(βx)2(βx)α−1e−βxdx=Γ(α)−1β−1β2∫0∞(βx)(α+2)−1e−βxdx=Γ(α)−1βΓ(α+2)β∫0∞Γ(α+2)−1β−1(βx)(α+2)−1e−βxdx=Γ(α)−1β2(α+1)αΓ(α)=αβ2(α+1)
よって分散は,
V(x)=E(x2)−E(x)2=αβ2(α+1)−α2β2=αβ2
積率母関数
積率母関数の導出
Mx(t)=E(etX)=∫0∞etxfX(x)dx=∫0∞etxΓ(α)−1β−1(βx)α−1e−βxdx=Γ(α)−1β−1∫0∞(βx)α−1e−β1xetxdx=Γ(α)−1β−1∫0∞(xβ1β1−tβ1−t⋅ββ)α−1exp{−x(β1−t)}dx=Γ(α)−1β−1∫0∞{x(β1−t)⋅(β1−t)−1β−1}α−1exp{−x(β1−t)}dx=Γ(α)−1β−1β1−α(β1−t)1−α∫0∞{x(β1−t)}α−1exp{−x(β1−t)}dx=Γ(α)−1β−α(β1−t)1−α(β1−t)−1Γ(α)∫0∞(β1−t)Γ(α)−1{x(β1−t)}α−1exp{−x(β1−t)}dx=β−α(β1−t)−α={β(β1−t)}−α=(1−tβ)−α
積率母関数を用いた期待値の導出
E(X)=MX(t)′∣t=0=dtd(1−tβ)−α∣t=0=−α(1−tβ)−(α+1){(1−tβ)}′∣t=0=−α(1−tβ)−(α+1)(−β)∣t=0=αβ(1−tβ)−(α+1)∣t=0=αβ(1−0⋅β)−(α+1)=αβ
積率母関数を用いた分散の導出
E(X)=MX(t)′′∣t=0={αβ(1−tβ)−(α+1)}′∣t=0=αβ(α+1)(1−tβ)−(α+2){(1−tβ)}′∣t=0=−αβ(α+1)(1−tβ)−(α+2)(−β)∣t=0=−αβ(α+1)(1−tβ)−(α+2)(−β)∣t=0=−αβ(α+1)(1−0⋅β)−(α+2)(−β)=αβ2(α+1)
V(X)=E(X2)−E(X)2=αβ2(α+1)−(αβ)2=αβ2
再生性
ガンマ分布は,パラメータ α について再生性が成立する.
{Xi}i={1,2,…,n}, i.i.d. ∼Gam(αi,β)
M∑Xi(t)=E(et∑Xi)=E(∏etXi)=∏E(etXi)∵Xis are i.i.d. =∏(1−tβ)−αi=(1−tβ)−∑αi
以上より,
∑Xi∼Gamma(∑αi,β)
ただし,パラメータ β について再生性が成立しないので注意.
{Xi}i={1,2,…,n}, i.i.d. ∼Gam(α,βi)
M∑Xi(t)=E(et∑Xi)=E(∏etXi)=∏E(etXi)∵xi s are i.i.d. =∏(1−tβi)−α=(1−t∑βi)−α
ガンマ分布を用いたベイズモデル (Poasson-Gamma Model)
以下の問題設定を考える.
x∣λ∼Po(λ),fx∣λ(x)=(x!)−1λxe−λλ∼Gam(α,β),fλ(λ)=Γ(α)−1β−1(βλ)α−1e−βλλ∣X∼Fλ∣X(λ)
事後分布の導出
logfλ∣X=logfX∣λ(X)fλ(λ)=logfX∣λ+logfλ(λ)=logi=1∏Nfx(xi)+logfλ(λ)∝∑{−log(xi!)+xilogλ−λ}+(α−1)logβλ−βλ∝{∑xi}logλ−Nλ+(α−1)logλ−β1λ={α+(∑xi)−1}logλ−βNβ+1λ
以上より,事後分布がいかに定まる.
λ∣X∼Gam(α+∑xi,β(Nβ+1)−1)
予測分布の導出
データ X を観測した後の xの分布を考える.
X∗∣X,α′β′∼F
このとき確率密度関数は,
fXk(x∗)=======∫0∞fX∣λ(x)fλ(λ)dλ=∫0∞(x!)−1λxe−λΓ(α′)−1β′−1(β′λ)α−1e−βλdλ=(x!)−1Γ(α′)−1β′−1∫0∞λxe−λ(β′λ)α−1e−βλdλ=(x!)−1Γ(α′)−1β′−1∫0∞exp{−λ(1+β′1)}β′x(β′λ)x(β′λ)α−1dλ=(x!)−1Γ(α′)−1β′x−1∫0∞exp{−λ(1+β′1)}(λβ′1)α+x−1dλ(x!)−1Γ(α′)−1β′x−1∫0∞exp{−λ(1+β′1)}(λβ′11+β′11+β′1⋅β′β′)α+x−1dλ(x!)−1Γ(α′)−1β′x−1∫0∞exp{−λ(1+β′1)}λ(1+β′1)(β′+1)−1}α+x−1dλ(x!)−1Γ(α′)−1β′x−1(β′+1)1−α−x∫0∞exp{−λ(1+β1)}{λ(1+β′1)}α+x−1dλ(x!)−1Γ(α′)−1β′x−1(β′+1)1−α−xΓ(α′+x)(1+β′1)−1∫0∞Γ(α′+x)−1(1+β′1)exp{−λ(1+β′1)}{λ(1+β′1)}α+x−1dλ(x!)−1Γ(α′)−1Γ(α′+x)β′x−1(β′+1)1−α−x(β′+1β′)(x!)−1Γ(α′)−1Γ(α′+x)β′(β′+1)−(α+x)
この分布をPoisson-Gamma分布という.負の二項分布に対応していることに注意する.最後にこの分布の期待値と分散を求める.
E(X∗)E(X∗2)V(X∗2)=Eλ[EX∗∣λ(X∗∣λ)]=Eλ[λ]=αβ=Eλ[EX∗∣λ(X∗2∣λ)]=Eλ[λ2+λ]=Ex[λ2]+Eλ[λ]=αβ2(1+α)+αβ=αβ2(1+α)+αβ−α2β2=αβ2+αβ=αβ2(1+β)
参考文献
(1) 竹村彰通.”新装改訂版 現代数理統計学”.2020.学術図書出版社
(2) 久保川."現代数理統計学の基礎".2017.共立出版
(3) C.M.ビショップ.”パターン認識と機械学習 上 ベイズ理論による統計的予測”.2019.丸善出版
(4) 須山敦志.”機械学習スタートアップシリーズ ベイズ推論による機械学習入門”.2018.講談社サイエンティフィク
更新
2024.08.14: 構成を一部変更,再生性,ベイズモデルの章を追加
Discussion