概要
- 統計検定準1級を受験するにあたって,自身で大事だなと思うpointをまとめており,何個か作っているチートシートのうちの一つです.
- 今回は連続型確率分布の分野に関する記事です.
抑えておく基本事項
積率母関数(モーメント母関数)
定義
積率母関数は確率母関数において s=et とおいたものであり,連続型確率変数の場合に用いられることが多い.積率母関数 M(t) は,確率変数 X に対して,t を任意の実数とするとき,X の積率母関数は以下のように定義される.
M(t)=E[etX]=G(et)
使い方
積率母関数 M(t) を微分すると,M′(t)=E[XetX],M′′(t)=E[X2etX] であるが,ここで t=0 を代入すると
M′(0)=E[X]M′′(0)=E[X2]
を得る.これよりXの期待値と分散が
E[X]=M′(0)V[X]=E[X2]−(E[X])2=M′′(0)−(M′(0))2
のように表される事がわかる.
主な連続型確率分布
連続一様分布
a<b を満たす a,b に対し,確率密度関数
f(x)=⎩⎨⎧b−a10(a≤x≤b)(otherwise)
をもつ分布を連続一様分布といい,U(a,b) で表す.
X∼U(a,b) のとき,平均と分散は
E[X]V[X]=2a+b=12(b−a)2
となる.
(3)の証明
期待値の定義より求める
E[X]=∫−∞∞xf(x)dx=∫abx⋅b−a1dx=b−a1∫ab(21x2)′dx=b−a1[21x2]ab=2(b−a)b2−a2=2a+b
(4)の証明
E[X2] を求め,式(9) V[X]=E[X2]−(E[X])2 より求める
E[X2]∴V[X]=∫−∞∞x2f(x)dx=∫−∞∞x2⋅b−a1dx=b−a1∫−∞∞(31x3)′dx=b−a1[31x3]ab=3(b−a)b3−a3=3(b−a)(b−a)(b2−ab+a2)=3b2−ab+a2=E[X2]−(E[X])2=3b2−ab+a2−(2a+b)2=124(b2−ab+a2)−123(a2+2ab+b2)=12b2−2ab+a2=12(b−a)2
また,積率母関数は以下のようになる.
M(t)=(b−a)tebt−eat,−∞<t<∞
積率母関数を使った期待値の計算
E[X]=M′(0) を用いて期待値を求める.
E[X]=M′(0)=((b−a)tebt−eat)′t=0={(b−a)t}2(bebt−aeat)(b−a)t−(ebt−eat)(b−a)t=0=(b−a)t2(bebt−aeat)t−(ebt−eat)t=0
ロピタルの定理を前述の式に適応させて計算すると,以下のように期待値が導ける.
=t→0lim2(b−a)t{(b2ebt−a2eat)t+(bebt−aeat)}−(bebt−aeat)(∵ロピタルの定理)=t→0lim2(b−a)t(b2ebt−a2eat)t=t→0lim2(b−a)b2ebt−a2eat=2(b−a)(b−a)(b+a)=2a+b
(5)の証明
積率母関数の定義より求める.
M(t)=E[etX]=∫−∞∞etxf(x)dx=∫−∞aetxf(x)dx+∫baetxf(x)dx+∫b∞etxf(x)dx=0+∫baetxf(x)dx+0=∫baetx⋅b−a1dx=(b−a)1∫ba(tetx)′dx=(b−a)1[tetx]ab=(b−a)tebt−eat
さらに,連続型一様分布は再生性を持たない.
再生性を持たないことの証明
独立な二つの確率変数を考え X,Y を考える.X∼U(a,b),Y∼U(c,d) にそれぞれ従うとき,X+Y の積率母関数を計算する.この時,積率母関数が同じ形になっていないことを示す.
MX+Y(t)=E[et(X+Y)]=E[etXetY]=E[etX]E[etY](∵XとYは独立なため(5)式)=MX(t)⋅MY(t)=(b−a)tebt−eat⋅(d−c)tedt−ect={(b+d)−(a+c)}te(b+d)t−e(a+c)t
正規分布
実数 μ と σ>0 に対し,確率密度関数
f(x)=2πσ1exp[−2σ2(x−μ)2]
をもつ分布を正規分布あるいはガウス分布といい,N∼(μ,σ2) で表す.
特に μ=0,σ2=1 のときの N(0,1)は,標準正規分布 と呼ばれる.Z∼N(0,1) の確率密度関数は ϕ(z),累積分布関数は Φ(z) で表される.
ϕ(z)Φ(z):=2π1e−2z2:=P(Z≤z)=∫−∞zϕ(t)dt,Z∼N(0,1)
標準正規分布の確率密度関数の導出
X∼N(μ,σ2)とし,正規分布の確率密度関数 fX(x)=2πσ1exp[−2σ2(x−μ)2] を用いて,標準正規分布の確率密度関数を導出する.
Φ(z)ϕ(z)=P(Z≤z)ここで,Z=σX−μの変数変換を考えると=P(σX−μ≤z)=P(X≤σz+μ)=FX(σz+μ)ここで,確率密度関数と累積分布関数の関係f(x)=dxd∫−∞xf(t)dtを計算すれば良く=dzdFX(σz+μ)=FX′(σz+μ)×σ=fX(σz+μ)×σ=2πσ1exp[−2σ2{(σz+μ)−μ}2]⋅σ=2π1exp(−2z2)
(6)が確率密度関数になることの証明
変数変換を用いた重積分を使って証明する
f(x)=2π1exp(−2x2) は標準正規分布 N(0,12) の確率密度関数である.
I=∫−∞∞exp(−2x2)dx
とおく,これより,
I2={∫−∞∞exp(−2x2)dx}{∫−∞∞exp(−2y2)dy}=∫−∞∞∫−∞∞exp(−2x2+y2)dxdy
の重積分を考える.x=rcosθ, y=rsinθ と変換(これを極座標変換と呼ぶ)すると,x:−∞→∞,y:−∞→∞ のとき r:0→∞,θ:0→2π となる.また,ヤコビアンは
J=∂r∂x∂r∂y∂θ∂x∂θ∂y=cosθsinθ−rsinθrcosθ=rcos2θ+rsin2θ=r
である.これらより,
I2=∫0π∫0∞exp(−2(rcosθ)2+(rsinθ)2)∣J∣drdθ=∫02π{∫0∞exp(−2r2)rdr}dθ=∫02π[−exp(−2r2)]0∞dθ=∫02π[0−(−1)]dθ=∫02π1dθ=2π
を得る.これより,I=2π であるから,
⇔2π=∫−∞∞exp(−2x2)dx∫−∞∞2π1exp(−2x2)dx=1
X∼N(μ,σ2) のとき,平均と分散は
E[X]V[X]=μ=σ2
となる.
(8)の証明
①期待値の定義から求める
E[X]=∫−∞∞xf(x)dx=∫−∞∞x⋅2πσ1exp[−2σ2(x−μ)2]dx=∫−∞∞(x−μ+μ)⋅2πσ1exp[−2σ2(x−μ)2]dx=∫−∞∞(x−μ)⋅2πσ1exp[−2σ2(x−μ)2]dx+∫−∞∞μ2πσ1exp[−2σ2(x−μ)2]dx=∫−∞∞(σx−μ)2π1exp[−21(σx−μ)2]dx+μ∫−∞∞2πσ1exp[−2σ2(x−μ)2]dx=∫−∞∞(σx−μ)2π1exp[−21(σx−μ)2]dx+μここでy=σx−μとおくと,dxdy=σ1⇔dx=σdy=∫−∞∞y⋅2π1exp(−21y2)σdy+μ=2πσ∫−∞∞y⋅exp(−21y2)dy+μ=0+μ(∵y⋅e−21y2は奇関数であるから)=μ
②標準正規分布の期待値から求める
確率変数 X が標準正規分布 N(0,1) に従うとする.このとき Y=σX+μ と変換すると正規分布 N(μ,σ2) に従うことから
E[Y]=E[σX+μ]=σE[X]+μ=σ⋅0+μ=μ
(9)の証明
① E[X2] を求め,式(9) V[X]=E[X2]−(E[X])2 より求める
E[X2]∴V[X]=∫−∞∞x2f(x)dx=∫−∞∞x2⋅2πσ1exp[−2σ2(x−μ)2]dx=∫−∞∞{(x−μ)2+2μx−μ2}⋅2πσ1exp[−2σ2(x−μ)2]dx=∫−∞∞(x−μ)2⋅2πσ1exp[−2σ2(x−μ)2]dx+∫−∞∞2μx⋅2πσ1exp[−2σ2(x−μ)2]dx−∫−∞∞μ2⋅2πσ1exp[−2σ2(x−μ)2]dx=∫−∞∞(x−μ)2⋅2πσ1exp[−2σ2(x−μ)2]dx+2μ∫−∞∞x⋅2πσ1exp[−2σ2(x−μ)2]dx−μ2∫−∞∞2πσ1exp[−2σ2(x−μ)2]dx=∫−∞∞(x−μ)2⋅2πσ1exp[−2σ2(x−μ)2]dx+2μ⋅μ−μ2⋅1=∫−∞∞(σx−μ)2⋅2πσexp[−21(σx−μ)2]dx+μ2ここでy=σx−μとおくと,dxdy=σ1⇔dx=σdy=∫−∞∞y2⋅2πσexp(−2y2)σdy+μ2=2πσ2∫−∞∞y2⋅exp(−2y2)dy+μ2=2πσ2∫−∞∞−y⋅(−ye−2y2)dy+μ2=2πσ2∫−∞∞−y⋅(e−2y2)′dy+μ2=2πσ2{[−y⋅e−2y2]∞−∞−∫−∞∞−1⋅e−2y2dy}+μ2=0+2πσ2∫−∞∞e−2y2dy+μ2=σ2∫−∞∞2π1e−2y2dy+μ2=σ2×1+μ2(∵標準正規分布の確率密度関数であるから,∫−∞∞2π1e−2y2dy=1)=σ2+μ2=E[X2]−(E[X])2=σ2+μ2−μ2=σ2
②標準正規分布の分散から求める
確率変数 X が標準正規分布 N(0,1) に従うとする.このとき Y=σX+μ と変換すると正規分布 N(μ,σ2) に従うことから
V[Y]=V[σX+μ]=σ2V[X]=σ2⋅1=σ2
また,積率母関数は以下のようになる.
M(t)=exp(μt+21σ2t2),−∞<t<∞
積率母関数を使った期待値と分散の計算
E[X]=M′(0) を用いて期待値を求める.
E[X]=M′(0)={exp(μt+21σ2t2)}′t=0={exp(μt+21σ2t2)⋅(μ+σ2t)}t=0=exp(μ⋅0+21σ202)⋅(μ+σ2⋅0)=exp(0)⋅μ=μ
E[X2]=M′′(0) を用いて分散を求める.
E[X2]∴V[X]=M′′(0)={exp(μt+21σ2t2)}′′t=0={exp(μt+21σ2t2)⋅(μ+σ2t)2+exp(μt+21σ2t2)⋅σ2}t=0=exp(μ⋅0+21σ202)⋅(μ+σ2⋅0)2+exp(μ⋅0+21σ202)⋅σ2=exp(0)⋅μ2+exp(0)σ2=μ2+σ2=E[X2]−(E[X])2=(μ2+σ2)−μ2=σ2
(10)の証明
積率母関数の定義より求める.
M(t)=E[etX]=∫−∞∞etxf(x)dx=∫−∞∞etx2πσ1exp[−2σ2(x−μ)2]dx=∫−∞∞2πσ1exp[−2σ2x2−2μx−2σ2tx+μ2]dx=∫−∞∞2πσ1exp[−2σ2x2−2(μ+σ2t)x+μ2]dx=∫−∞∞2πσ1exp[−2σ2{x−(μ+σ2t)}2−(μ+σ2t)2+μ2]dx=exp(−2σ2−(μ+σ2t)2+μ2)∫−∞∞2πσ1exp[−2σ2{x−(μ+σ2t)}2]dx=exp(2σ22μσ2t+σ4t2)(∵∫−∞∞2πσ1exp[−2σ2{x−(μ+σ2t)}2]dx=1)=exp(μt+21σ2t2)
さらに,正規分布には,再生性とよばれる次の性質がある.X1∼N(μ1,σ12),X1∼N(μ2,σ22)で,X1 と X2 が独立ならば,X1+X2∼N(μ1+μ2,σ12+σ22) となる.
再生成を持つことの証明
独立な二つの確率変数 X1, X2 を考える.X1∼N(μ1,σ12),X2∼N(μ2,σ22) にそれぞれ従うとき,X1+X2 の積率母関数を計算する.この時,積率母関数が同じ形になっていることを示す.
MX1+X2=E[et(X1+X2)]=E[etX1etX2]=E[etX1etX2]=E[etX1]E[etX2]=exp(μ1t+21σ12t2)⋅exp(μ2t+21σ22t2)=exp((μ1+μ2)t+21(σ12+σ22)t2)
指数分布
ある期間(単位時間)あたりに平均して λ (λ>0) 回起こる現象が,次に起こるまでの期間を X とする.このとき X の従う分布を指数分布といい,確率密度関数は
f(x)={λe−λx0(x>0)(x≤0)
となり,Exp(λ) で表す.ランダムなイベントの発生間隔を表す分布であり, 例えば「地震が起きる間隔」や「電球の寿命」は(おおよそ)指数分布に従うと言われている.
X∼Exp(λ) の累積分布関数は,
F(x)=P(X≤x)=1−e−λx,x>0
と明示的に書ける.
(11)の証明
累積分布関数の定義から求める
F(x)=P(X≤x)=∫−∞xf(t)dt=∫0xλe−λtdt=∫0x(−e−λt)′dt=[−e−λt]0x=−e−λx−(−e0)=1−e−λx
他の分布との関連を以下の表にまとめる.
分布一覧 |
指数分布との関係 |
ポアソン分布 |
ポアソン分布はある期間に起こる回数に関する分布であり,指数分布は次に起こるまでの期間に関する分布である. |
幾何分布 |
幾何分布は,指数分布の離散バージョンである. |
ガンマ分布 |
ガンマ分布は指数分布の一般化であり,指数分布はガンマ分布のパラメータ 形状母数 α を 1 としたもの. |
X∼Exp(λ) のとき,平均と分散は
E[X]V[X]=λ1=λ21
となる.
(12)の証明
期待値の定義から求める
E[X]=∫−∞∞xf(x)dx=∫0∞x⋅λe−λxdx=∫0∞x⋅(−e−λx)′dx=[x(−e−λx)]0∞−∫0∞−e−λxdx=[−e−λxx]0∞+λ1∫0∞λe−λxdx=0−0+λ1(∵∫0∞λe−λxdx=1)=λ1
(13)の証明
E[X2] を求め,式(9) V[X]=E[X2]−(E[X])2 より求める
E[X2]∴V[X]=∫−∞∞x2f(x)dx=∫0∞x2⋅λe−λxdx=∫0∞x2⋅(−e−λx)′dx=[x2(−e−λx)]0∞−∫0∞−2xe−λxdx=[−e−λxx2]0∞−∫0∞λ2x⋅(e−λx)′dx=0−0−[λ2x(−e−λx)]0∞+∫0∞λ2⋅e−λxdx=−(0−0)+λ22∫0∞λe−λxdx=λ22(∵∫0∞λe−λxdx=1)=E[X2]−(E[X])2=λ22−(λ1)2=λ21
また,積率母関数は以下のようになる.
M(t)=λ−tλ=(1−λ1t)−1,t<λ
積率母関数を使った期待値と分散の計算
E[X]=M′(0) を用いて期待値を求める.
E[X]=M′(0)={(1−λ1t)−1}′t=0={−1(1−λ1t)−2⋅−λ1}t=0={(1−λ1⋅0)−2⋅λ1}=λ1
E[X2]=M′′(0) を用いて分散を求める.
E[X2]∴V[X]=M′′(0)={(1−λ1t)−1}′′t=0={2(1−λ1t)−3⋅(−λ1)2}t=0={2(1−λ1⋅0)−3⋅(−λ1)2}=λ22=E[X2]−(E[X])2=λ22−(λ1)2=λ21
(14)の証明
積率母関数の定義より求める.
M(t)=E[etX]=∫0∞etxf(x)dx=∫0∞etxλe−λxdx=∫0∞λe(−λ+t)xdx=∫0∞λ⋅λ−tλ−te−(λ−t)xdx=λ−tλ∫0∞(λ−t)e−(λ−t)xdx=λ−tλ(∵∫0∞(λ−t)e−(λ−t)xdx=1)=(1−λ1t)−1
さらに,指数分布の無記憶性と呼ばれる性質として,X∼Exp(λ) のとき
P(X≥t1+t2∣X≥t1)=P(X≥t2),t1,t2≥0
が成り立つ.
(15)の証明
t≥0 に対して P(X≥t)=1−F(t)=e−λt となるため,t1,t2≥0 に対して P(X≥t1+t2∣X≥t1)=e−λ(t1+t2)/e−λt1=e−λt2=P(X≥t2) となることからわかる.
ガンマ分布
ある期間 β ごとに平均して 1 回起こる現象が,α 回起きるまでの期間(時間)を X とする.このとき X の従う分布を,形状母数 α,尺度母数 βの ガンマ分布といい,確率密度関数は
f(x)=⎩⎨⎧Γ(α)βα1xα−1e−βx0(x>0)(x≤0)
となり,Ga(α,β) で表す.ここで,Γ(α) はガンマ関数
Γ(α):=∫0∞xα−1e−xdx,α>0
を表す.特に α=1 の場合のガンマ分布 Ga(1,β) は,λ=1/β とした指数分布 Exp(1/β) である.
α=1 の場合のガンマ分布が指数分布になることの証明
ガンマ分布の確率密度関数の形状母数 α に 1 を代入して求める
f(x)=Γ(1)β11x1−1e−βx=0!β1x0e−βx(∵Γ(1)=(1−1)!=0!)=β1e−βx
この式は,パラメータ 1/β である指数分布の確率密度関数に一致する.
ガンマ分布が確率密度関数になることの証明
全確率が 1 になることを示す
∫0∞f(x)dx=∫0∞Γ(α)βα1xα−1e−βxdx=Γ(α)βα1∫0∞xα−1e−βxdx
ここで,βx=t という置換積分を行う.
すると,dx=βdt となるので,次のように変形できる.
=Γ(α)βα1∫0∞(βt)α−1e−t(βdt)=Γ(α)βαβα∫0∞tα−1e−tdt=Γ(α)βαβα⋅Γ(α)(∵(29))=1
X∼Ga(α,β) のとき,平均と分散は
E[X]V[X]=αβ=αβ2
となる.
(17)の証明
①期待値の定義から求める
E[X]=∫−∞∞xf(x)dx=∫0∞x⋅Γ(α)βα1xα−1e−βxdx=∫0∞Γ(α)βα1x(α+1)−1e−βxdx=∫0∞αβαΓ(α)βα+11x(α+1)−1e−βxdx=αβ∫0∞Γ(α+1)βα+11x(α+1)−1e−βxdx(∵Γ(α+1)=αΓ(α))=αβ(∵∫0∞Γ(α+1)βα+11x(α+1)−1e−βxdx=1)
②指数分布から考える
X1,X2,…,Xn が互いに独立に指数分布 Exp(λ) に従う時,Y=X1+X2+⋯+Xn がパラメータが (n,1/λ) のガンマ分布に従うので,
E[Y]=E[X1+X2+⋯+Xn]=E[X1]+E[X2]+⋯+E[Xn]=nE[X1]=λn(∵指数分布の期待値は1/λ)=αβ(∵n=α,1/λ=βと置き換えた)
(18)の証明
① E[X2] を求め,式(9) V[X]=E[X2]−(E[X])2 より求める
E[X2]∴V[X]=∫−∞∞x2f(x)dx=∫0∞x2⋅Γ(α)βα1xα−1e−βxdx=∫0∞Γ(α)βα1x(α+2)−1e−βxdx=∫0∞(α+1)αβ2(α+1)αΓ(α)βα+21x(α+2)−1e−βxdx=(α+1)αβ2∫0∞Γ(α+2)βα+21x(α+2)−1e−βxdx(∵Γ(α+2)=(α+1)Γ(α+1)=(α+1)αΓ(α))=(α+1)αβ2(∵∫0∞Γ(α+2)βα+21x(α+2)−1e−βxdx=1)=E[X2]−(E[X])2=(α+1)αβ2−(αβ)2=αβ2
②指数分布から考える
X1,X2,…,Xn が互いに独立にの指数分布 Exp(λ) に従う時,Y=X1+X2+⋯+Xn がパラメータが (n,1/λ) のガンマ分布に従うので,
V[Y]=V[X1+X2+⋯+Xn]=V[X1]+V[X2]+⋯+V[Xn](∵X1,X2,…,Xnは独立)=nV[X1]=nλ21(∵指数分布の分散は1/λ2)=αβ2(∵n=α,1/λ=βと置き換えた)
また,積率母関数は以下のようになる.
M(t)=(1−βt)−α,t<β1
積率母関数を使った期待値と分散の計算
E[X]=M′(0) を用いて期待値を求める.
E[X]=M′(0)={(1−βt)−α}′t=0={(−α)(1−βt)−α−1⋅(−β)}′t=0={αβ(1−βt)−α−1}′t=0=αβ
E[X2]=M′′(0) を用いて期待値を求める.
E[X2]∴V[X]=M′′(0)={(1−βt)−α}′′t=0={αβ(−α−1)(1−βt)−α−2⋅(−β)}′′t=0={α(α+1)β2(1−βt)−α−2}′′t=0=α(α+1)β2=E[X2]−(E[X])2=α(α+1)β2−(αβ)2=αβ2
(19)の証明
積率母関数の定義より求める.
M(t)=E[etX]=∫0∞etxf(x)dx=∫0∞etxΓ(α)βα1xα−1e−βxdx=∫0∞Γ(α)βα1xα−1e−β1−βtxdx=(1−βt)−α∫0∞Γ(α)(1−βtβ)α1xα−1e−β1−βtxdx=(1−βt)−α(∵∫0∞Γ(α)(1−βtβ)α1xα−1e−β1−βtx=1)
さらに,ガンマ分布には,再生性とよばれる次の性質がある.X1∼Ga(α1,β),X1∼Ga(α2,β)で,X1 と X2 が独立ならば,X1+X2∼Ga(α1+α2,β) となる.
再生成を持つことの証明
独立な二つの確率変数 X1, X2 を考える.X1∼Ga(α1,β),X1∼Ga(α2,β) にそれぞれ従うとき,X1+X2 の積率母関数を計算する.この時,積率母関数が同じ形になっていることを示す.
MX1+X2=E[et(X1+X2)]=E[etX1etX2]=E[etX1etX2]=E[etX1]E[etX2]=(1−βt)−α1(1−βt)−α2=(1−βt)−(α1+α2)
ベータ分布
ある試行について,成功数が m 回,失敗回数が n 回としたときに,成功する確率を X とする.このとき区間 (0,1) の X の従う分布を,パラメータ (α,β)=(m+1,n+1) の ベータ分布といい,確率密度関数は
f(x)=B(α,β)1xα−1(1−x)β−1,0<x<1
となり,Be(α,β) で表す.ここで,B(α,β) はベータ関数
B(α,β):=∫01xα−1(1−x)β−1dx,α>0,β>0
を表す.ベータ分布はガンマ分布から得ることができる.
ガンマ分布からベータ分布を導けることの証明
2つの独立な確率変数 X1∼Ga(α1,β),X2∼Ga(α2,β) に対し, U=X1/(X1+X2) の従う分布を求める
U=X1/(X1+X2),V=X1+X2 の変数変換を考えると,逆変換は
⎩⎨⎧u=x1+x2x1v=x1+x2⇔{x1=uvx2=(1−u)v
となり,ヤコビアンは
J((u,v)→(x1,x2))=det(∂u∂x1∂u∂x2∂v∂x1∂v∂x2)=det(v−vu1−u)=v(1−u)−u(−v)=v
となる.したがって,(U,V) の同時確率密度関数は
fU,V(u,v)=fX1(uv)fX2((1−u)v)z=(Γ(α1)βα11(uv)α1−1e−βuv)(Γ(α2)βα21{(1−u)v}α2−1e−β(1−u)v)v=(Γ(α1)Γ(α2)Γ(α1+α2)uα1−1(1−u)α2)(Γ(α1+α2)βα1+α21v(α1+α2)−1e−βv)=(B(α1,α2)1uα1−1(1−u)α2)(Γ(α1+α2)βα1+α21v(α1+α2)−1e−βv)(∵ベータ関数の定義)=f(u)f(v)
となることから,U は Be(α1,α2) に従うことが示された.
X∼Be(α,β) のとき,平均と分散は
E[X]V[X]=α+βα=(α+β)2(α+β+1)αβ
(20)の証明
期待値の定義から求める
E[X]=∫−∞∞xf(x)dx=∫01x⋅B(α,β)1xα−1(1−x)β−1dx=B(α,β)1∫01x(α+1)−1(1−x)β−1dx=B(α,β)1⋅B(α+1,β)(∵ベータ関数の定義)=Γ(α)Γ(β)Γ(α+β)⋅Γ(α+β+1)Γ(α+1)Γ(β)=Γ(α)Γ(β)Γ(α+β)⋅(α+β)Γ(α+β)αΓ(α)Γ(β)=α+βα
(21)の証明
E[X2] を求め,式(9) V[X]=E[X2]−(E[X])2 より求める
E[X2]∴V[X]=∫−∞∞x2f(x)dx=∫01x2⋅B(α,β)1xα−1(1−x)β−1dx=B(α,β)1∫01x(α+2)−1(1−x)β−1dx=B(α,β)1⋅B(α+2,β)=Γ(α)Γ(β)Γ(α+β)⋅Γ(α+β+2)Γ(α+2)Γ(β)=Γ(α)Γ(β)Γ(α+β)⋅(α+β+1)(α+β)Γ(α+β)(α+1)αΓ(α)Γ(β)=(α+β+1)(α+β)(α+2)(α+1)=E[X2]−(E[X])2=(α+β+1)(α+β)(α+1)α−(α+βα)2=(α+β)2(α+β+1)(α+1)α(α+β)−(α+β)2(α+β+1)α2(α+β+1)=(α+β)2(α+β+1)α{(α2+αβ+α+β)−(α2+αβ+α)}=(α+β)2(α+β+1)αβ
標準コーシー分布
標準コーシー分布は裾が重い分布であり,平均やより高次のモーメントが存在しない.確率密度関数は
f(x)=π(1+x2)1
となり,原点に関して対称ではあるが,0 は平均ではない.
標準コーシー分布は一様分布から導けることの証明
確率変数X が区間 −2π<X<2π において,一様分布に従うとき,Y=tanX の従う分布を求める
Y=tanX の変数変換を考えると,逆変換は
x=tan−1(y)
となり,これを y で微分すると,
dydg−1(y)=1+y21
となる.また,fX(x)=π1 であるから,
fX(g−1(y))=π1
となる.したがって,Y の確率密度関数は
fY(y)=fX(g−1(y))∣dydg−1(y)∣=π1⋅1+y21=π(1+y2)1
となることから,Y は標準コーシー分布に従うことが示された.
標準コーシー分布は期待値を持たないことの証明
期待値の定義通りに計算し,確かめる
E[X]=∫−∞∞xf(x)dx=∫−∞∞x⋅π(1+x2)1dx=π1∫−∞∞(21log(1+x2))′dx=π1[21log(1+x2)]−∞∞=π1{b→∞lim21log(1+b2)−a→−∞lim21log(1+a2)}=∞−∞
と計算され,積分が収束せずに定義されない.
より一般に,位置母数 μ と尺度母数 σ>0 を導入し,式 (35) の f(x) に対して
σ1f(σx−μ)=πσ(1+(σx−μ)2)1
を確率密度関数とする分布を一般にコーシー分布という.
対数正規分布
Y∼N(μ,σ2) のとき,X=eY(>0)は,確率密度関数
f(x)=2πσx1exp(−2σ2(logx−μ)2),x>0
をもつ分布に従う.この確率密度関数をもつ分布を対数正規分布といい,Λ(μ,σ2) で表す.X∼Λ(μ,σ2)のとき,logX∼N(μ,σ2) である.
対数正規分布の導出
X∼N(μ,σ2) とし,正規分布の確率密度関数 fX(x)=2πσ1exp[−2σ2(x−μ)2] を用いて,対数正規分布の確率密度関数を導出する.
FZ(z)fZ(z)=P(Z≤z)ここで,Z=eXの変数変換を考えると=P(eX≤z)=P(X≤logz)=FX(logz)ここで,確率密度関数と累積分布関数の関係f(x)=dxd∫−∞xf(t)dtを計算すれば良く=dzdFX(logz)=FX′(logz)×z1=fX(logz)×z1=2πσ1exp[−2σ2(logz−μ)2]×z1=2πσz1exp[−2σ2(logz−μ)2]
X∼Λ(μ,σ2) のとき,平均と分散は
E[X]V[X]=exp(μ+21σ2)=exp(2μ+σ2)(exp(σ2)−1)
(25)の証明
①期待値の定義から求める
E[X]=∫−∞∞xf(x)dx=∫0∞x⋅2πσx1exp[−2σ2(logx−μ)2]dx=∫0∞2πσ1exp(−2σ2(logx−μ)2)dxここで,logx−μ=tとおくと,xが0から∞へ動くときは,tは−∞から∞へ動くこと,また,x=et+μなので,dx=et+μdtであるからlogx−μ=tの置換積分を行うと=∫−∞∞2πσ1exp[−2σ2t2]et+μdt=exp(μ)∫−∞∞2πσ1exp[−2σ2t2+t]dt=exp(μ)∫−∞∞2πσ1exp[−2σ2t−2σ2]dt=exp(μ)∫−∞∞2πσ1exp[−2σ2(t−σ2)2+2σ2σ4]dt=exp(μ)⋅exp(2σ2σ4)∫−∞∞2πσ1exp[−2σ2(t−σ2)2]dt=exp(μ+21σ2)(∵∫−∞∞2πσ1exp[−2σ2(t−σ2)2]dt=1)
② Y が正規分布に従うとき,eY の期待値を計算する
E[eY]=∫−∞∞eyf(y)dy=∫−∞∞ey⋅2πσ1exp[−2σ2(y−μ)2]dy=∫−∞∞2πσ1exp[−2σ2(y−μ)2+y]dy=∫−∞∞2πσ1exp[−2σ2y2−2μy+μ2−2σ2y]dy=∫−∞∞2πσ1exp[−2σ2{y−(μ+σ2)}2−(2μσ2+σ4)]dy=exp[2σ22μσ2+σ4]∫−∞∞2πσ1exp[−2σ2{y−(μ+σ2)}2]dy=exp(μ+21σ2)(∵∫−∞∞2πσ1exp[−2σ2{y−(μ+σ2)}2]dy=1)
(26)の証明
① E[X2] を求め,式(9) V[X]=E[X2]−(E[X])2 より求める
E[X2]∴V[X]=∫−∞∞x2f(x)dx=∫0∞x2πσ1exp(−2σ2(logx−μ)2)dxここで,logx−μ=tとおくと,xが0から∞へ動くときは,tは−∞から∞へ動くこと,また,x=et+μなので,dx=et+μdtであり,logx−μ=tの置換積分を行うと=∫−∞∞et+μ2πσ1exp[−2σ2t2]et+μdt=exp(2μ)∫−∞∞2πσ1exp[−2σ2t2+2t]dt=exp(2μ)∫−∞∞2πσ1exp[−2σ2t2−4tσ2]dt=exp(2μ)∫−∞∞2πσ1exp[−2σ2(t−2σ2)2+2σ24σ4]dt=exp(2μ)exp(2σ24σ4)∫−∞∞2πσ1exp[−2σ2(t−2σ2)2]dt=exp(2μ+2σ2)(∵∫−∞∞2πσ1exp[−2σ2(t−2σ2)2]dt=1)=E[X2]−(E[X])2=exp(2μ+2σ2)−{exp(μ+21σ2)}2=exp(2μ+2σ2)−exp(2μ+σ2)=exp(2μ)exp(σ2)exp(σ2)−exp(2μ)exp(σ2)=exp(2μ)exp(σ2)(exp(σ2)−1)=exp(2μ+σ2)(exp(σ2)−1)
② Y が正規分布に従うとき,eY の分散を計算する
E[X2]=E[X2Y] であるから,
E[e2Y]∴V[X]=∫−∞∞e2yf(y)dy=∫−∞∞e2y⋅2πσ1exp[−2σ2(y−μ)2]dy=∫−∞∞2πσ1exp[−2σ2(y−μ)2+2y]dy=∫−∞∞2πσ1exp[−2σ2y2−2μy+μ2−4σ2y]dy=∫−∞∞2πσ1exp[−2σ2{y−(μ+2σ2)}2−(4μσ2+4σ4)]dy=exp[2σ24μσ2+4σ4]2πσ1exp[−2σ2{y−(μ+2σ2)}2]dy=exp(2μ+2σ2)(∵2πσ1exp[−2σ2{y−(μ+2σ2)}2]dy=1)=E[X2]−(E[X])2=exp(2μ+2σ2)−{exp(μ+21σ2)}2=exp(2μ+2σ2)−exp(2μ+σ2)=exp(2μ)exp(σ2)exp(σ2)−exp(2μ)exp(σ2)=exp(2μ)exp(σ2)(exp(σ2)−1)=exp(2μ+σ2)(exp(σ2)−1)
正規分布の積率母関数を使った期待値と分散の計算
正規分布 N(μ,σ2) に従う確率変数 Y に対し,X=eY に従う分布が対数正規分布であることから,Y の積率母関数を用いて平均と分散を計算する.
Y の積率母関数は
MY(t)=E[etY]=exp(μt+2σ2t2)
であることから,Y を X で表すと
E[etlogX]=E[elogXt]=E[Xt]=exp(μt+2σ2t2)
となり,対数正規分布の t 次モーメントが正規分布の積率母関数に対応していることがわかる.つまり,MY(t) が X の t 次モーメントになる.
E[X]=M(1) を用いて期待値を求める.
E[X]=M(1)=exp(μt+2σ2t2)t=1=exp(μ+21σ2)
V[X]=E[X2]−(E[X])2=M(2)−(M(1))2 を用いて期待値を求める.
E[X2]∴V[X]=exp(μt+2σ2t2)t=2=exp(2μ+2σ2)=E[X2]−(E[X])2=exp(2μ+2σ2)−{exp(μ+21σ2)}2=exp(2μ+2σ2)−exp(2μ+σ2)=exp(2μ)exp(σ2)exp(σ2)−exp(2μ)exp(σ2)=exp(2μ)exp(σ2)(exp(σ2)−1)=exp(2μ+σ2)(exp(σ2)−1)
2変量正規分布
実数 μ1,μ2 と σ1>0,σ2>0,さらに −1<ρ<1 を満たす ρ に対し,確率ベクトル X=(X1,X2)⊤ が同時確率密度関数
f(x1,x2)=2π∣Σ∣1/21exp[−21(x−μ)⊤Σ−1(x−μ)]
をもつとき,X は平均ベクトル μ,分散共分散行列 Σ2 の2変量正規分布に従うといい,この分布を N2(μ,Σ2) で表す.ただし
μ=(μ1,μ2)⊤,Σ2=(σ12ρσ1σ2ρσ1σ2σ22)
とする.
また,(27)式を成分表示すると
f(x1,x2)=2πσ1σ21−ρ21×exp[−2(1−ρ2)1{(σ1x1−μ1)2−2ρ(σ1x1−μ1)(σ2x2−μ2)+(σ2x2−μ2)2}]
となる.パラメータ ρ は X1 X2 の相関係数を表すが,ρ=0 の場合には,同時確率密度関数 f(x1,x2) が,N(μ1,σ12) と N(μ2,σ22) の確率密度関数の積に分かれ,X1 と X2 は独立になる.
2変量正規分布の確率密度関数の導出
独立な標準正規分布 Z=(Z1,Z2)⊤ の変数変換より求める
Z1,Z2 がそれぞれ独立に標準正規分布 N2(0,I2) に従うとする.ことのき,Z の同時確率密度関数 g は
gZ(z)=gZ1(z1)×gZ2(z2)=(2π)21exp[−2z12+z22]=2π1exp[−2z⊤z]
となる.ここで2変量の正規分布に拡張するために,線形変換を用いて定義される確率変数 X=AZ+μ を導入する.
Xμ=(X1,X2)⊤=(μ1,μ2)⊤
ただし,A∈R2×2 は正則であり,μ は期待値を結合したベクトルを表す.
ここで,X=AZ+μ, Y=W の変数変換を考えると,逆変換は
{X=AZ+μY=W⇔{Z=A−1(X−μ)W=Y
となり,ヤコビアンは
J((Z,W)→(X,Y))=det(∂X∂Z∂X∂W∂Y∂Z∂Y∂W)=det(A−1O2O2I2)=∣A−1∣∣I2−O2AO2∣(∵∣A∣=0のとき,∣Z∣=ACBD=∣A∣∣D−CA−1B∣)=∣A−1∣=∣A∣−1(∵Aが正則なら,∣A−1∣=∣A∣−1)
となる.ここで fX(x)=gZ(z)⋅abs∣A∣−1 であるから,
fX(x)=2π1exp[−2{A−1(x−μ)}⊤{A−1(x−μ)}]⋅abs∣A∣−1=2π1exp[−2(x−μ)⊤(A−1)⊤A−1(x−μ)]⋅abs∣A∣−1=2π1exp[−2(x−μ)⊤(A⊤)−1A−1(x−μ)]⋅abs∣A∣−1=2π1exp[−2(x−μ)⊤(AA⊤)−1(x−μ)]⋅abs∣A∣−1
あとは AA⊤ と abs∣A∣−1 を求めれば導出が完了する.
まずは,AA⊤ から求める.X の分散を求めると,
V[X]=E[(X−μ)(X−μ)⊤]=E[AZ(AZ)⊤]=E[AZZ⊤A⊤]=AE[ZZ]A⊤(∵E[AXB]=AE[X]B)
ここで Z は2次元標準正規分布に従うことから,
V[Z]=E[ZZ⊤]=I2 であるので,
V[X]=AA⊤=Σ2(∵Xの分散共分散行列をΣ2とおいた)
つぎに,abs∣A∣−1を求める.AA⊤=Σ の関係を使う.
abs∣Σ∣∴abs∣A∣∴abs∣A∣−1=abs∣AA⊤∣=abs∣A∣⋅abs∣A⊤∣(∵∣AB∣=∣A∣∣B∣)=abs∣A∣⋅abs∣A∣(∵∣A⊤∣=∣A∣)=(abs∣A∣)2=(abs∣Σ2∣)1/2=∣Σ2∣1/2(∵分散共分散行列は半正定値行列であるから∣Σ2∣≥0)=∣Σ2∣−1/2
求めた AA⊤ と abs∣A∣−1 を fX(x) の式に代入して
fX(x)=2π1exp[−2(x−μ)⊤(Σ2)−1(x−μ)]⋅∣Σ2∣−1/2=2π∣Σ2∣1/21exp[−2(x−μ)⊤(Σ2)−1(x−μ)]
成分表示の証明
(28)を用いて(27)式を行列表示を成分表示に戻す
まずは,∣Σ∣1/2 を計算する.
∣Σ∣1/2=σ12ρσ1σ2ρσ1σ2σ221/2={σ12⋅σ22−(ρσ1σ2)2}1/2={σ12σ22(1−ρ2)}1/2=σ1σ21−ρ2
次に (x−μ)⊤(Σ2)−1(x−μ) を計算する.
Σ−1=σ12σ22(1−ρ2)1(σ22−ρσ1σ2−ρσ1σ2σ12)=1−ρ21(σ121−σ1σ2ρ−σ1σ2ρσ221)
(x−μ)⊤(Σ2)−1(x−μ)=1−ρ21(x1−μ1x2−μ2)(σ121−σ1σ2ρ−σ1σ2ρσ221)(x1−μ1x2−μ2)=1−ρ21(σ121(x1−μ1)−σ1σ2ρ(x1−μ1)−σ1σ2ρ(x2−μ2)+σ221(x2−μ2))(x1−μ1x2−μ2)=1−ρ21{σ121(x1−μ1)2−σ1σ2ρ(x1−μ1)(x2−μ2)−σ1σ2ρ(x1−μ1)(x2−μ2)+σ221(x2−μ2)2}=1−ρ21{(σ1x1−μ1)2−2ρ(σ1x1−μ1)(σ2x2−μ2)+(σ2x2−μ2)2}
求めた ∣Σ∣1/2 と (x−μ)⊤(Σ2)−1(x−μ) を(40)式に代入して
f(x1,x2)=2πσ1σ21−ρ1exp[−2(1−ρ2)1{(σ1x1−μ1)2−2ρ(σ1x1−μ1)(σ2x2−μ2)+(σ2x2−μ2)2}]
ρ=0 のときの同時確率密度関数
成分表示した同時確率密度関数に ρ=0 を代入し,2つの正規分布の確率密度関数で表せることを示す
\begin{align*}
f(x_1, x_2) &= \frac{1}{2\pi\sigma_1\sigma_2} \exp\left[-\frac{1}{2} \left\{ \left(\frac{x_1 - \mu_1}{\sigma_1}\right)^2 + \left(\frac{x_2 - \mu_2}{\sigma_2}\right)^2 \right\} \right] \\
&= \frac{1}{\sqrt{2\pi}\sigma_1}\frac{1}{\sqrt{2\pi}\sigma_2} \exp\left[ -\frac{1}{2} \left(\frac{x_1 - \mu_1}{\sigma_1}\right)^2 \right] \exp\left[ -\frac{1}{2} \left(\frac{x_2 - \mu_2}{\sigma_2}\right)^2 \right] \\
&= \frac{1}{\sqrt{2\pi}\sigma_1} \exp\left[ -\frac{(x_1 - \mu_1)^2}{2\sigma_1^{\, ^2}} \right] \times \frac{1}{\sqrt{2\pi}\sigma_2} \exp\left[ -\frac{(x_2 - \mu_2)^2}{2\sigma_2^{\, ^2}} \right]
\end{align*}
X∼N2(μ,Σ2) のとき,平均ベクトルと分散共分散行列は
E[X]V[X]=μ=Σ2
となる.
(29)の証明
平均ベクトルの定義から求める
2次元分布の期待値は,
E[X]=(E[X1]E[X2])
と定義されるので,X1,X2 それぞれの期待値を求める.
X1 の期待値は
E[X1]=∫−∞∞∫−∞∞x1f(x1,x2)dx1dx2=∫−∞∞x1(∫−∞∞f(x1,x2)dx2)dx1=∫−∞∞x1f(x1)dx1(∵∫−∞∞f(x1,x2)dx2はx1の周辺確率密度関数である)=μ1(∵X1∼(μ1,σ12))
X2 の期待値も同様にして μ2 を得る.
以上より,2変量正規分布の期待値ベクトルは
E[X]=(E[X1]E[X2])=(μ1μ2)
(30)の証明
分散共分散行列の定義から求める
V[X]=E[{x−E(x)}{x−E(x)}⊤]=E[(x−μ)(x−μ)⊤]=E[(x1−μ1x2−μ2)(x1−μ1x2−μ2)]=(E[(x1−μ1)2]E[(x1−μ1)(x2−μ2)]E[(x1−μ1)(x2−μ2)]E[(x2−μ2)2])=(σ12σ12σ12σ22)=(σ12ρσ1σ2ρσ1σ2σ22)(∵ρ=σ1σ2σ12)=Σ2
X1 と X2 の周辺分布は,それぞれ N(μ1,σ12) と N(μ2,σ22) となる.
周辺分布の証明
周辺分布の定義から求める
f(x1)=∫−∞∞f(x1,x2)dx2=∫−∞∞2πσ1σ21−ρ21×exp[−2(1−ρ2)1{(σ1x1−μ1)2−2ρ(σ1x1−μ1)(σ2x2−μ2)+(σ2x2−μ2)2}]dx2=∫−∞∞2πσ1σ21−ρ21×exp[−2(1−ρ2)1{σ1σ2−2ρ(x1−μ1)(x2−μ2)+(σ2x2−μ2)2}]×exp[−2(1−ρ2)1(σ1x1−μ1)2]dx2=∫−∞∞2πσ1σ21−ρ21×exp[−2(1−ρ2)σ221{(x2−μ2)2−σ12ρσ2(x1−μ1)(x2−μ2)}]×exp[−2(1−ρ2)1(σ1x1−μ1)2]dx2=∫−∞∞2πσ1σ21−ρ21×exp[−2(1−ρ2)σ221{((x2−μ2)−σ1ρσ2(x1−μ1))2}−σ12ρ2σ22(x1−μ1)2]×exp[−2(1−ρ2)1(σ1x1−μ1)2]dx2=∫−∞∞2πσ1σ21−ρ21×exp[−2(1−ρ2)σ221{((x2−μ2)−σ1ρσ2(x1−μ1))2}]×exp[−2(1−ρ2)1{(σ1x1−μ1)2−(σ1ρ(x1−μ1))2}]dx2=2πσ11exp[−2σ12(x1−μ1)2]∫−∞∞2π1−ρ2σ21×exp[−2(1−ρ2)σ221{((x2−μ2)−σ1ρσ2(x1−μ1))2}]dx2ここでx2−μ2=yとおくとdx2=dyであり,1−ρ2σ2=σ,σ1ρσ2(x1−μ1)=μとおくと=2πσ11exp[−2σ12(x1−μ1)2]∫−∞∞2πσ1exp[−2σ2(y−μ)2]dy=2πσ11exp[−2σ12(x1−μ1)2](∵∫−∞∞2πσ1exp[−2σ2(y−μ)2]dy=1)
同様にして,f(x2)=2πσ21exp[−2σ22(x2−μ2)2] を得る.
x1,x2 の周辺分布は, それぞれ N(μ1,σ12) と N(μ2,σ22) の確率密度関数に一致する.
また,X1=x1 が与えられたときの X2 の条件付き分布は,正規分布となり,その期待値と分散は
E[X2∣X1=x1]V[X2∣X1=x1]=μ2+ρ⋅σ1σ2(x1−μ1)=μ2+σ12σ12(x1−μ1)=(1−ρ2)σ22=σ12∣Σ∣
となる.
条件付き分布の証明
条件付き分布の定義から求める
f(x2∣x1)=f(x1)f(x1,x2)=2π(1−ρ2)σ21×exp[−2(1−ρ2)1{(σ1x1−μ1)2−2ρ(σ1x1−μ1)(σ2x2−μ2)+(σ2x2−μ2)2}]×exp[2σ12(x1−μ1)2]=2π(1−ρ2)σ21×exp[−2(1−ρ2)1{(σ1x1−μ1)2−2ρ(σ1x1−μ1)(σ2x2−μ2)+(σ2x2−μ2)2}]×exp[2σ12(x1−μ1)2]=2π(1−ρ2)σ21×exp[−2(1−ρ2)1{σ1σ2−2ρ(x1−μ1)(x2−μ2)+(σ2x2−μ2)2}]×exp[−2(1−ρ2)1(σ1x1−μ1)2]×exp[2σ12(x1−μ1)2]=2π(1−ρ2)σ21×exp[−2(1−ρ2)σ221{((x2−μ2)−σ1ρσ2(x1−μ1))2}−σ12ρ2σ22(x1−μ1)2]×exp[−2(1−ρ2)1(σ1x1−μ1)2]×exp[2σ12(x1−μ1)2]=2π(1−ρ2)σ21×exp[−2(1−ρ2)σ221{((x2−μ2)−σ1ρσ2(x1−μ1))2}]×exp[−2(1−ρ2)1{(σ1x1−μ1)2−(σ1ρ(x1−μ1))2}]×exp[2σ12(x1−μ1)2]=2π(1−ρ2)σ21×exp[−2(1−ρ2)σ221{((x2−μ2)−σ1ρσ2(x1−μ1))2}]×exp[−2σ12(x1−μ1)2]×exp[2σ12(x1−μ1)2]=2π(1−ρ2)σ21×exp[−2(1−ρ2)σ221{((x2−μ2)−σ1ρσ2(x1−μ1))2}]=2π1−ρ2σ21×exp−2(1−ρ2)σ22{x2−(μ2+σ1ρσ2(x1−μ1))}2
これは,N(μ2+σ1ρσ2(x1−μ1),(1−ρ2)σ22) の正規分布の確率密度関数である.
(31)の証明
①条件付き分布のパラメータから求める
条件付き分布 f(x2∣x1) は 2π1−ρ2σ21×exp[−2(1−ρ2)σ22{x2−(μ2+σ1ρσ2(x1−μ1))}2] と表せるので,期待値は μ2+σ1ρσ2(x1−μ1) とわかる.
E[X2∣X1]=μ2+σ1ρσ2(x1−μ1)=μ2+σ12σ12(x1−μ1)(∵ρ=σ1σ2σ12)
②単回帰による証明
単回帰モデルは E[X2∣X1=x1]=β0+β1x2 と表せ,β0=μ2−β1μ1,β1=σ12σ12 であるから,
E[X2∣X1]=β0+β1x2=μ2−σ12σ12μ1+σ12σ12x1=μ2+σ12σ12(x1−μ1)
(32)の証明
条件付き分布のパラメータから求める
条件付き分布 f(x2∣x1) は 2π1−ρ2σ21×exp[−2(1−ρ2)σ22{x2−(μ2+σ1ρσ2(x1−μ1))}2] と表せるので,分散は (1−ρ2)σ22 とわかる.
V[X2∣X1]=(1−ρ2)σ22=σ12∣Σ∣(∵∣Σ∣=σ12σ22−ρ2σ12σ22=(1−ρ2)σ12σ22)
さらに,積率母関数は以下のようになる.
M(t)=E[et⊤X]=exp(μ⊤t+21t⊤Σt)t∈R2
積率母関数を使った平均ベクトルと分散共分散行列の計算
E[X]=M′(0) を用いて平均ベクトルを求める.
E[X]=M′(0)=∂t∂{exp(μ⊤t+21t⊤Σt)}t=0(∵∂x∂f=∂x∂u∂u∂f)=(μ+21(Σ+Σ⊤)t)exp(μ⊤t+21t⊤Σt)t=0=(μ+Σt)exp(μ⊤t+21t⊤Σt)t=0(∵Σは対称行列のため,Σ=Σ⊤)=(μ+Σ0)exp(μ⊤0+210⊤Σ0)=μ
E[XX⊤]=M′′(0) を用いて分散共分散行列を求める.
E[XX⊤]∴V[X]=M′′(0)=∂t∂t⊤∂2{exp(μ⊤t+21t⊤Σt)}t=0=∂t∂{(μ+Σt)⊤exp(μ⊤t+21t⊤Σt)}t=0(∵∂x⊤∂f(x)=(∂x1∂f(x),…,∂xn∂f(x)))=∂t∂{exp(μ⊤t+21t⊤Σt)(μ+Σt)⊤}t=0(∵exp(μ⊤t+21t⊤Σt)はスカラー)={(μ+Σt)exp(μ⊤t+21t⊤Σt)(μ+Σt)⊤+exp(μ⊤t+21t⊤Σt)(0+Σ)}t=0=[{(μ+Σt)(μ+Σt)⊤+Σ}exp(μ⊤t+21t⊤Σt)]t=0=μμ⊤+Σ=E[(X−E[X])(X−E[X])⊤]=E[XX⊤−XE[X]⊤−E[X]X⊤+E[X]E[X]⊤]=E[XX⊤]−E[X]E[X]⊤−E[X]E[X]⊤+E[X]E[X]⊤=E[XX⊤]−E[X]E[X]⊤=μμ⊤+Σ−μμ⊤=Σ
(33)の証明
①積率母関数の定義より求める.
M(t)=E[et⊤X]=∫−∞∞∫−∞∞exp(t⊤x)2π∣Σ∣1/21exp[−21(x−μ)⊤Σ−1(x−μ)]dx1dx2=∫−∞∞∫−∞∞2π∣Σ∣1/21exp[t⊤x−21(x−μ)⊤Σ−1(x−μ)]dx1dx2=∫−∞∞∫−∞∞2π∣Σ∣1/21exp[t⊤x−21{(x⊤−μ⊤)Σ−1(x−μ)}]dx1dx2=∫−∞∞∫−∞∞2π∣Σ∣1/21exp[t⊤x−21{(x⊤Σ−1−μ⊤Σ−1)(x−μ)}]dx1dx2=∫−∞∞∫−∞∞2π∣Σ∣1/21exp[t⊤x−21(x⊤Σ−1x−μ⊤Σ−1x−x⊤Σ−1μ+μ⊤Σ−1μ)]dx1dx2
ここで,μ⊤Σ−1x と x⊤Σ−1μ はスカラーであるから以下が成り立つ.
μ⊤Σ−1x=(μ⊤Σ−1x)⊤=x⊤(Σ−1)⊤(μ⊤)⊤=x⊤Σ−1μ(∵Σは対称行列)
元の計算式に戻って,
=∫−∞∞∫−∞∞2π∣Σ∣1/21exp[t⊤x−21(x⊤Σ−1x−2μ⊤Σ−1x+μ⊤Σ−1μ)]dx1dx2=∫−∞∞∫−∞∞2π∣Σ∣1/21exp[−21(x⊤Σ−1x−2μ⊤Σ−1x−2t⊤ΣΣ−1x+μ⊤Σ−1μ)]dx1dx2=∫−∞∞∫−∞∞2π∣Σ∣1/21exp[−21{x⊤Σ−1x−2(μ⊤+t⊤Σ)Σ−1x+μ⊤Σ−1μ}]dx1dx2=∫−∞∞∫−∞∞2π∣Σ∣1/21exp[−21{x⊤Σ−1x−2(μ+Σt)⊤Σ−1x+μ⊤Σ−1μ}]dx1dx2((t⊤Σ)⊤=Σ⊤t=Σt)
となる.さらに x⊤Σ−1x−2(μ+Σt)⊤Σ−1x には二次形式の平方完成 x⊤A−1x+2p⊤A−1x=(x+p)⊤A−1(x+p)−p⊤A−1p(Aは対称行列) が成り立つので,
x⊤Σ−1x−2(μ+Σt)⊤Σ−1x={x−(μ+Σt)}⊤Σ−1{x−(μ+Σt)}−(μ+Σt)⊤Σ−1(μ+Σt)={x−(μ+Σt)}⊤Σ−1{x−(μ+Σt)}−(μ⊤Σ−1+t⊤ΣΣ−1)(μ+Σt)={x−(μ+Σt)}⊤Σ−1{x−(μ+Σt)}−(μ⊤Σ−1μ+t⊤μ+μ⊤t+t⊤Σt)={x−(μ+Σt)}⊤Σ−1{x−(μ+Σt)}−(μ⊤Σ−1μ+2μ⊤t+t⊤Σt)
となる.これを元の計算式に代入して,
=∫−∞∞∫−∞∞2π∣Σ∣1/21exp[−21[{x−(μ+Σt)}⊤Σ−1{x−(μ+Σt)}−(μ⊤Σ−1μ+2μ⊤t+t⊤Σt)++μ⊤Σ−1μ]]dx1dx2=∫−∞∞∫−∞∞2π∣Σ∣1/21exp[−21{x−(μ+Σt)}⊤Σ−1{x−(μ+Σt)}]exp(μ⊤t+21t⊤Σt)dx1dx2=exp(μ⊤t+21t⊤Σt)∫−∞∞∫−∞∞2π∣Σ∣1/21exp[−21{x−(μ+Σt)}⊤Σ−1{x−(μ+Σt)}]dx1dx2=exp(μ⊤t+21t⊤Σt)(∵∫−∞∞∫−∞∞2π∣Σ∣1/21exp[−21{x−(μ+Σt)}⊤Σ−1{x−(μ+Σt)}]dx1dx2=1)
②2変量標準正規分布の積率母関数より求める.
確率変数 Z∼N2(0,I) の積率母関数を求めると,
MZ(t)=E[exp(t⊤Z)]=E[exp(t1Z1+t2Z2)]=E[exp(t1Z1)exp(t2Z2)]=E[exp(t1Z1)]E[exp(t2Z2)](∵Z1,Z2は独立に標準正規分布に従う)=exp(21t12)exp(21t22)(∵標準正規分布の積率母関数)=exp(21(t12+t22))=exp(21t⊤t)
となり,X=μ+Σ21Z∼N2(μ,Σ) の積率母関数は,
MX(t)=E[exp(t⊤X)]=E[exp{t⊤(μ+Σ21Z)}]=exp(t⊤μ)E[exp(t⊤Σ21Z)]=exp(t⊤μ)E[exp(Σ21t)⊤Z]=exp(μ⊤t)E[exp{(Σ21t)⊤Z}]=exp(μ⊤t)exp{(Σ21t)⊤(Σ21t)}(∵E[exp{(Σ21t)⊤Z}]=MZ(Σ21t))=exp(μ⊤t)exp(t⊤Σt)=exp(μt⊤+t⊤Σt)
X∼N2(μ,Σ) である時,正則行列 A およベクトル b を用いて,線形変換した Y=AX+b が従う分布は
Y=AX+b∼N2(Aμ+b,AΣA⊤)
となる.
(34)の証明
① Y=AX+b の変数変換を単純に計算する
Y=AX+b より,逆変換を考えると X=A−1(Y−b) となり,成分表示だと
(x1x2)=X=A−1(Y−b)=(a11a21a12a22)(y1−b1y2−b2)=(a11(y1−b1)+a12(y2−b2)a21(y1−b1)+a22(y2−b2))
と表せるので,ヤコビ行列 J は
J=(∂y1∂x1∂y1∂x2∂y2∂x1∂y2∂x2)=(a11a21a12a22)=A−1
であるから,∣J∣=∣A−1∣ を式変形すると,
∣A−1∣=∣A∣1=(∣A∣)21=∣A∣⋅∣A⊤∣1(∵∣P∣=∣P⊤∣)=∣A∣⋅∣Σ∣⋅∣A⊤∣∣Σ∣=∣AΣA⊤∣∣Σ∣(∵∣P∣∣Q∣=∣PQ∣)
となるので,確率密度関数 fY(y) は
fY(y)=2π∣Σ∣1/21exp[−21{A−1(y−b)−μ}⊤Σ−1{A−1(y−b)−μ}]⋅∣AΣA⊤∣∣Σ∣=2π∣AΣA⊤∣1/21exp[−21{A−1(y−b−Aμ)}⊤Σ−1{A−1(y−b−Aμ)}]=2π∣AΣA⊤∣1/21exp[−21{(y−b−Aμ)⊤(A−1)⊤}Σ−1{A−1(y−b−Aμ)}]=2π∣AΣA⊤∣1/21exp[−21(y−b−Aμ)⊤(A⊤)−1Σ−1A−1(y−b−Aμ)](∵(P⊤)−1=(P−1)⊤)=2π∣AΣA⊤∣1/21exp[−21(y−b−Aμ)⊤(AΣA⊤)−1(y−b−Aμ)]=2π∣AΣA⊤∣1/21exp[−21{y−(Aμ+b)}⊤(AΣA⊤)−1{y−(Aμ+b)}]
となり,これは Y∼N(Aμ+b,AΣA⊤) の確率密度関数である.
② 積率母関数を使って求める
まず,Y=AX+b の積率母関数を考える.
E[et⊤Y]=E[et⊤(AX+b)]=et⊤bE[et⊤AX]=et⊤bE[e(A⊤t)⊤X]
ここで,2変量正規分布の積率母関数を導入すると,
et⊤bE[e(A⊤t)⊤X]=exp(t⊤b)⋅exp{μ⊤(A⊤t)+21(A⊤t)⊤Σ(A⊤t)}=exp{μ⊤A⊤t+b⊤t+21(A⊤t)⊤Σ(A⊤t)}(∵t⊤bはスカラーなので,t⊤b=b⊤t)=exp{(Aμ)⊤t+b⊤t+21t⊤AΣA⊤t}=exp[(Aμ+b)⊤t+21{t⊤(AΣA⊤)t}]
積率母関数と確率密度関数は1対1に対応するので,式(46)の係数と比較すると,
Y∼N(Aμ+b,AΣA⊤)
参考資料
Discussion
確率分布の変換まとめ。非常に助かります!!!
いくつか間違いかも知れない場所がありましたので報告させていただきます
正規分布の積率母関数、「E[X^2]=M"(0)を用いて分散を求める」の次の行でE[X^2]がE[X]になっています。また、最後がμ^2 + σ^2ではなくμ^2 - σ^2になっています
指数分布 (13)の証明のV[X]で2乗が無いところがあります
ご確認お願いします
ご連絡ありがとうございました,大変助かります!
ご指摘いただいた箇所はすべて修正しました.