はじめに
標本相関係数の密度関数はかなり複雑な形をしているので、どう導き出されるか見ていってください。
そもそも相関係数についてよくわからない方はこちらの記事をチェック
https://zenn.dev/totopironote/articles/8893534302ba55
問題
今回の問題は、エフロンとヘイスティ(2020)「大規模計算時代の統計推論」の32ページ(3.11)式です。
確率変数(m,v)の同時分布が2変数正規分布に従うときの標本相関係数の確率密度関数です。
mとvの標本相関係数 θ^ は、以下のように書ける。
θ^=i=1∑n(mi−mˉ)(vi−vˉ)/[i=1∑n(mi−mˉ)2i=1∑n(vi−vˉ)2]1/2
ただし, nはデータ数, mˉ=∑i=1nmi,vˉ=∑i=1nvi
このとき, θ の関数としての θ^ の密度関数は,以下のように書ける。
fθ(θ^)=π(n−2)(1−θ2)2n−1(1−θ^2)2n−4∫0∞(coshω−θθ^)n−1dω
この式の導出をします。
導出
(mv)∼N(μ,Σ),μ=(μmμv),Σ=(σm2θσmσvθσmσvσv2)
と仮定する。
不偏共分散行列Sは次のように書ける。
(n−1)S=[∑i=1n(mi−mˉ)2∑i=1n(mi−mˉ)(vi−vˉ)∑i=1n(mi−mˉ)(vi−vˉ)∑i=1n(vi−vˉ)2]
W=(n−1)S=(w11w12w12w22)
とおくと,
W∼W2(n−1,Σ)
となる。
θ^=w11w22w12=σm2w11σv2w22w12/σmσv,D=(σm200σv2)
とおくと,
D−21ΣD−21=(1θθ1),D−21WD−21=(σm2w11σmσvw12σmσvw12σv2w22)
D−21WD−21∼W2(n−1,D−21ΣD−21)
よって,
W∼W2(n−1,D−21ΣD−21)
とみなすことができる。(新しい文字で置き換えたと捉えたほうがわかりやすい)
自由度n-1,共分散行列 Σ のウィシャート分布の密度関数は,以下のように書ける。
f(w)=2(n−1)Γ2(2n−1)∣Σ∣2n−1∣W∣2n−4exp{−21tr(Σ−1W)}
ルジャンドルの倍数公式 Γ(z)Γ(z+21)=21−2zπΓ(2z)を用いて,
Γ2(2n−1)=πΓ(2n−1)Γ(2n−2)=2(3−n)πΓ(n−2)
∣W∣=w11w22−w122,∣Σ∣=1−θ2tr(Σ−1W)=1−θ21(w11+w22−2θw12)
以上を用いると密度関数は、
fθ(w11,w22,w12) =4πΓ(n−2)(1−θ2)2n−1(w11w22−w122)2n−4exp{−2(1−θ2)w11+w22−2θw12}
w11w22(ヤコビアン)をかけることに注意して,
fθ(w11,w22,θ^)=4πΓ(n−2)(1−θ2)2n−1(w11w22(1−θ^2))2n−4exp{−2(1−θ2)w11+w22−2θθ^w11w22}w11w22
w11とw22を消すために積分する.
fθ(θ^)=4πΓ(n−2)(1−θ2)2n−1(1−θ^2)2n−4∫0∞∫0∞(w11w22)2n−3exp{−2(1−θ2)w11+w22+1−θ2θθ^w11w22}dw11dw22
変数変換 w11w22=α,w22w11=eβ を用いて,
2α(ヤコビアン)をかけることに注意して,
fθ(θ^)=2πΓ(n−2)(1−θ2)2n−1(1−θ^2)2n−4∫−∞∞∫0∞αn−2exp{−1−θ2coshβ−θθ^α}dαdβ
ガンマ関数を用いると,
fθ(θ^)=2π(n−2)(1−θ2)2n−1(1−θ^2)2n−4∫−∞∞(coshβ−θθ^)n−11dβ
coshβ−θθ^は偶関数なので,
fθ(θ^)=π(n−2)(1−θ2)2n−1(1−θ^2)2n−4∫0∞(coshω−θθ^)n−1dω
まとめ
最後まで読んでいただきありがとうございます。難しめでした。
ただ、導出を書いているのはこの記事だけでは?と思っているので、役に立てたら幸いです。
役に立ってたらいいねもお願いします。
参考文献
B.エフロン,T.J.ヘイスティ(2020)『大規模計算時代の統計推論: 原理と発展』 藤澤洋徳・井手剛監訳 (共立出版),p.32
Discussion