はじめに
今回は統計検定1級より 2012年 統計数理 問題5 の解答を記載します。
多変量正規分布の条件付き分布の問題であり、2012年の統計数理では最難関です。
条件付き分布の定理を知らないと計算量が膨大となり、制限時間内に解答するのはほぼ不可能でしょう。
問題については著作物のため割愛します。
前置き
X∼N(μ,Σ) について、(Σ は正則)
X=(X1X2),μ=(μ1μ2),Σ=(Σ11Σ21Σ12Σ22)
としたとき、X2=x2 を与えた下での X1 の条件付き分布は
X1∣X2=x2∼N(μ1+Σ12Σ22−1(x2−μ2),Σ11−Σ12Σ22−1Σ21)
となります。解答にはこの定理を利用します。
分散共分散行列が既知の場合は、比較的容易に条件付き分布を求められるので、覚えておいても損はないと思います。
[1]
X=(XY),μ=0,Σ=(1ρxyρxy1)X1=Y,X2=X,x2=xμ1=0,μ2=0Σ11=Σ22=1,Σ12=Σ21=ρxy
とすると、Y∣X=x について期待値は
E[Y∣X=x]=μ1+Σ12Σ22−1(x2−μ2)=0+ρxy/1⋅(x−0)=ρxyx
βx は
βx=ρxz
分散については
V[Y∣X=x]=Σ11−Σ12Σ22−1Σ21=1−ρxy/1⋅ρxy=1−ρxy2
[2]
X=YXZ,μ=0,Σ=1ρxyρyzρxy1ρxzρyzρxz1X1=Y,X2=(XZ),x2=(xz)μ1=0,μ2=0Σ11=1,Σ12=(ρxyρyz),Σ21=(ρxyρyz),Σ22=(1ρxzρxz1)
とすると、Y∣X=x,Z=z について期待値は
E[Y∣X=x,Z=z]=μ1+Σ12Σ22−1(x2−μ2)=0+(ρxyρyz)1−ρxz21(1−ρxz−ρxz1)(x−0z−0)=1−ρxz21(ρxyρyz)(x−ρxzz−ρxzx+z)=1−ρxz21(ρxyx−ρxyρxzz−ρyzρxzx+ρyzz)=1−ρxz2ρxy−ρyzρxzx+1−ρxz2ρyz−ρxyρxzz
αx,αz は
αx=1−ρxz2ρxy−ρyzρxzαz=1−ρxz2ρyz−ρxyρxz
分散については
V[Y∣X=x,Z=z]=Σ11−Σ12Σ22−1Σ21=1−(ρxyρyz)1−ρxz21(1−ρxz−ρxz1)(ρxyρyz)=1−1−ρxz21(ρxyρyz)(ρxy−ρxzρyz−ρxyρxz+ρyz)=1−1−ρxz2ρxy2−2ρxyρxzρyz+ρyz2
[3]
βx=αxより、
ρxy=1−ρxz2ρxy−ρyzρxz(1−ρxz2)ρxy=ρxy−ρyzρxzρxz2ρxy=ρyzρxzρxzρxy=ρyz
よって、必要十分条件は ρxzρxy=ρyz である。
[4]
V[Y∣X=x]=V[Y∣X=x,Z=z] より、
1−ρxy2=1−1−ρxz2ρxy2−2ρxyρxzρyz+ρyz2(1−ρxz2)ρxy2=ρxy2−2ρxyρxzρyz+ρyz2ρxz2ρxy2−2ρxyρxzρyz+ρyz2=0(ρxzρxy−ρyz)2=0
以上より、必要十分条件は ρxzρxy=ρyz となる。
Discussion