はじめに
今回はピアソン相関係数のフィッシャー変換(Fisher’s transformation)について取り上げます。フィッシャーのz変換と呼ばれることも多いです。
大規模計算時代の統計推論ではフィッシャーのφ変換として取り上げられています。
このフィッシャー変換で変換したパラメータの推定量の漸近分布を導出していきます。
問題
フィッシャー変換
\phi = m(\theta) = \frac{1}{2}\log \left(\frac{1+\theta}{1-\theta} \right) \tag{1}
\theta は真の相関係数であり、標本相関係数 \hat\theta を代入した点推定値は \hat\phi=m(\hat\theta) となる。
このとき \hat \phi の漸近分布は次のようになる。
\hat\phi \hspace{5pt}\dot{\sim}\hspace{5pt}N\left(\phi, \frac{1}{n-3}\right)\tag{2}
これを示す。
導出
W = \begin{pmatrix}w_{11} & w_{12} \\w_{12} & w_{22}\end{pmatrix}\thicksim W_2(n-1, \Sigma)\tag{3}
\Sigma =\begin{pmatrix}
\sigma_{11} & \sigma_{12}\\
\sigma_{21} & \sigma_{22}
\end{pmatrix} =\begin{pmatrix}
1 & \theta\\
\theta & 1
\end{pmatrix}\hspace{5pt}
,\hspace{5pt} \hat{\theta} = \frac{w_{12}}{\sqrt{w_{11}w_{22}}}
を仮定する。
※共分散行列\Sigma は簡単なためこのように書いているが、一般性を失わない。このことは、前回の記事「標本相関係数の密度関数の導出」を参照。
式(3)の意味は、Wが自由度n-1で2×2の共分散行列\Sigmaを持つウィシャート分布に従っていることを意味する。
ここで
u_{ij}=\frac{w_{ij}}{n-1} - \sigma_{ij} \hspace{5pt},\hspace{5pt}i,j= 1,2
とおく。
ウィシャート分布の期待値と分散から(次回以降で、できたら示す)
E[w_{ij}]=(n-1)\sigma_{ij},\text{Cov}(u_{ij},u_{kl}) =(n-1)(\sigma_{ik}\sigma_{jl}+\sigma_{il}\sigma_{jk}) がわかる。
これより n \to \infty のとき
\sqrt{n-1}\begin{pmatrix}
u_{11}\\
u_{22}\\
u_{12}\\
\end{pmatrix}
\xrightarrow{\mathrm{d}}
N\left(
\begin{pmatrix}
0\\
0\\
0\\
\end{pmatrix},
\begin{pmatrix}
2 & 2\theta^2 & 2\theta\\
2\theta^2 & 2 & 2\theta\\
2\theta & 2\theta & 1+\theta^2
\end{pmatrix}
\right)
\hat\theta をu_{ij}を用いて表すと
\hat \theta = \frac{\theta+u_{12}}{\sqrt{(1+u_{11})(1+u_{22})}}
ここで、(1+x)^{-\frac{1}{2}}のテイラー展開による一次近似は 1-\frac{1}{2}x である。これを用いると、
\begin{align*}
\hat\theta
&\fallingdotseq (\theta+u_{12})(1-\frac{1}{2}u_{11})(1-\frac{1}{2}u_{22})\\
&\fallingdotseq \theta+u_{12} - \frac{1}{2}\theta u_{11}- \frac{1}{2}\theta u_{22}\\
\end{align*}
よって
\begin{align*}
&(n-1)\text{Var}(\hat\theta-\theta)\\
&\begin{split}
=&(n-1)\{ \text{Var}(u_{12})+\frac{\theta^2}{4}\text{Var}(u_{11})+\frac{\theta^2}{4}\text{Var}(u_{22})\\
&-\theta\text{Cov}(u_{11},u_{12})
-\theta\text{Cov}(u_{22},u_{12})
+\frac{\theta^2}{2}\text{Cov}(u_{11},u_{22})\}
\end{split}\\
&=(1-\theta^2)^2
\end{align*}
したがって中心極限定理より、 n \to \infty のとき
\sqrt{n-1}(\hat\theta -\theta)
\xrightarrow{\mathrm{d}}
N(0,(1-\theta^2)^2)\tag{4}
さらにデルタ法(補足を参照)より n \to \infty のとき
\sqrt{n-1}(\hat\phi -\phi)
\xrightarrow{\mathrm{d}}
N(0,1)\tag{5}
つまり
\hat\phi \hspace{5pt} \dot{\sim}\hspace{5pt}N\left(\phi, \frac{1}{n-1}\right)
応用上、分散の分母はn-3の方が精度がいいらしい。(いろんなところで近似してるからちょっとズレるよな笑)
以上より
\hat\phi \hspace{5pt} \dot{\sim}\hspace{5pt}N\left(\phi, \frac{1}{n-3}\right) \tag{2}
が示せた。
補足
デルタ法(delta method) (T.Hastie,R.Tibshirani,J.Friedman、統計的学習の基礎から引用)
確率変数の列 \{U_n\}_{n=1,2,...} について、定数 \theta とa_n \uparrow \infty となる数列に対して、
a_n(U_n-\theta)\xrightarrow{\mathrm{d}}U であると仮定する。連続微分可能な関数g(・)について、点\thetaでg'(\theta)が存在し、g'(\theta)≠0 とする。このとき、
a_n(g(U_n)-g(\theta))\xrightarrow{\mathrm{d}} g'(\theta)U
が成り立つ。特に、\sqrt{n}(U_n-\mu)\xrightarrow{\mathrm{d}}N(0,\sigma^2) が成り立つ時には、デルタ法から
\sqrt{n}\{g(U_n)-g(\mu)\}\xrightarrow{\mathrm{d}}N(0,\sigma^2\{g'(\mu)\}^2)
となることがわかる。
フィッシャー変換(式(1))は\phi = \text{arctanh}(\theta)=g(\theta) なので g'(\theta)=\frac{1}{1-\theta^2}
よって式(4)から分散は (1-\theta^2)^2\times(\frac{1}{1-\theta^2})^2=1 となり式(5)が示せた。
最後に
フィッシャー変換により \hat\phi が正規分布に従うことがわかったので、逆変換により\theta の信頼区間を作ることができます。
次回はウィシャート分布の期待値と分散の導出頑張ります。
https://zenn.dev/totopironote/articles/5aa85fb88a6a55
分散の導出は難しくてできませんでした。もっと勉強してきます。
参考文献
- B.エフロン,T.ヘイスティ(2020)『大規模計算時代の統計推論: 原理と発展』 藤澤洋徳・井手剛監訳 (共立出版),p.32
- T.Hastie,R.Tibshirani,J.Friedman(2014)『統計的学習の基礎:データマイニング・推論・予測』(共立出版),p.99
Discussion