🟠

フィッシャー変換による推定量の漸近分布の導出

2023/10/05に公開

はじめに

今回はピアソン相関係数のフィッシャー変換(Fisher’s transformation)について取り上げます。フィッシャーのz変換と呼ばれることも多いです。

大規模計算時代の統計推論ではフィッシャーのφ変換として取り上げられています。

このフィッシャー変換で変換したパラメータの推定量の漸近分布を導出していきます。

問題

フィッシャー変換

\phi = m(\theta) = \frac{1}{2}\log \left(\frac{1+\theta}{1-\theta} \right) \tag{1}

\theta は真の相関係数であり、標本相関係数 \hat\theta を代入した点推定値は \hat\phi=m(\hat\theta) となる。

このとき \hat \phi の漸近分布は次のようになる。

\hat\phi \hspace{5pt}\dot{\sim}\hspace{5pt}N\left(\phi, \frac{1}{n-3}\right)\tag{2}

これを示す。

導出

W = \begin{pmatrix}w_{11} & w_{12} \\w_{12} & w_{22}\end{pmatrix}\thicksim W_2(n-1, \Sigma)\tag{3}
\Sigma =\begin{pmatrix} \sigma_{11} & \sigma_{12}\\ \sigma_{21} & \sigma_{22} \end{pmatrix} =\begin{pmatrix} 1 & \theta\\ \theta & 1 \end{pmatrix}\hspace{5pt} ,\hspace{5pt} \hat{\theta} = \frac{w_{12}}{\sqrt{w_{11}w_{22}}}

を仮定する。

※共分散行列\Sigma は簡単なためこのように書いているが、一般性を失わない。このことは、前回の記事「標本相関係数の密度関数の導出」を参照。

式(3)の意味は、Wが自由度n-1で2×2の共分散行列\Sigmaを持つウィシャート分布に従っていることを意味する。

ここで

u_{ij}=\frac{w_{ij}}{n-1} - \sigma_{ij} \hspace{5pt},\hspace{5pt}i,j= 1,2

とおく。

ウィシャート分布の期待値と分散から(次回以降で、できたら示す)

E[w_{ij}]=(n-1)\sigma_{ij},\text{Cov}(u_{ij},u_{kl}) =(n-1)(\sigma_{ik}\sigma_{jl}+\sigma_{il}\sigma_{jk}) がわかる。

これより n \to \infty のとき

\sqrt{n-1}\begin{pmatrix} u_{11}\\ u_{22}\\ u_{12}\\ \end{pmatrix} \xrightarrow{\mathrm{d}} N\left( \begin{pmatrix} 0\\ 0\\ 0\\ \end{pmatrix}, \begin{pmatrix} 2 & 2\theta^2 & 2\theta\\ 2\theta^2 & 2 & 2\theta\\ 2\theta & 2\theta & 1+\theta^2 \end{pmatrix} \right)

\hat\thetau_{ij}を用いて表すと

\hat \theta = \frac{\theta+u_{12}}{\sqrt{(1+u_{11})(1+u_{22})}}

ここで、(1+x)^{-\frac{1}{2}}のテイラー展開による一次近似は 1-\frac{1}{2}x である。これを用いると、

\begin{align*} \hat\theta &\fallingdotseq (\theta+u_{12})(1-\frac{1}{2}u_{11})(1-\frac{1}{2}u_{22})\\ &\fallingdotseq \theta+u_{12} - \frac{1}{2}\theta u_{11}- \frac{1}{2}\theta u_{22}\\ \end{align*}

よって

\begin{align*} &(n-1)\text{Var}(\hat\theta-\theta)\\ &\begin{split} =&(n-1)\{ \text{Var}(u_{12})+\frac{\theta^2}{4}\text{Var}(u_{11})+\frac{\theta^2}{4}\text{Var}(u_{22})\\ &-\theta\text{Cov}(u_{11},u_{12}) -\theta\text{Cov}(u_{22},u_{12}) +\frac{\theta^2}{2}\text{Cov}(u_{11},u_{22})\} \end{split}\\ &=(1-\theta^2)^2 \end{align*}

したがって中心極限定理より、 n \to \infty のとき

\sqrt{n-1}(\hat\theta -\theta) \xrightarrow{\mathrm{d}} N(0,(1-\theta^2)^2)\tag{4}

さらにデルタ法(補足を参照)より n \to \infty のとき

\sqrt{n-1}(\hat\phi -\phi) \xrightarrow{\mathrm{d}} N(0,1)\tag{5}

つまり

\hat\phi \hspace{5pt} \dot{\sim}\hspace{5pt}N\left(\phi, \frac{1}{n-1}\right)

応用上、分散の分母はn-3の方が精度がいいらしい。(いろんなところで近似してるからちょっとズレるよな笑)
以上より

\hat\phi \hspace{5pt} \dot{\sim}\hspace{5pt}N\left(\phi, \frac{1}{n-3}\right) \tag{2}

が示せた。

補足

デルタ法(delta method) (T.Hastie,R.Tibshirani,J.Friedman、統計的学習の基礎から引用)

確率変数の列 \{U_n\}_{n=1,2,...} について、定数 \thetaa_n \uparrow \infty となる数列に対して、
a_n(U_n-\theta)\xrightarrow{\mathrm{d}}U であると仮定する。連続微分可能な関数g(・)について、点\thetag'(\theta)が存在し、g'(\theta)≠0 とする。このとき、

a_n(g(U_n)-g(\theta))\xrightarrow{\mathrm{d}} g'(\theta)U

が成り立つ。特に、\sqrt{n}(U_n-\mu)\xrightarrow{\mathrm{d}}N(0,\sigma^2) が成り立つ時には、デルタ法から

\sqrt{n}\{g(U_n)-g(\mu)\}\xrightarrow{\mathrm{d}}N(0,\sigma^2\{g'(\mu)\}^2)

となることがわかる。

フィッシャー変換(式(1))は\phi = \text{arctanh}(\theta)=g(\theta) なので g'(\theta)=\frac{1}{1-\theta^2}

よって式(4)から分散は (1-\theta^2)^2\times(\frac{1}{1-\theta^2})^2=1 となり式(5)が示せた。

最後に

フィッシャー変換により \hat\phi が正規分布に従うことがわかったので、逆変換により\theta の信頼区間を作ることができます。

次回はウィシャート分布の期待値と分散の導出頑張ります。
https://zenn.dev/totopironote/articles/5aa85fb88a6a55

分散の導出は難しくてできませんでした。もっと勉強してきます。

参考文献

  • B.エフロン,T.ヘイスティ(2020)『大規模計算時代の統計推論: 原理と発展』 藤澤洋徳・井手剛監訳 (共立出版),p.32
  • T.Hastie,R.Tibshirani,J.Friedman(2014)『統計的学習の基礎:データマイニング・推論・予測』(共立出版),p.99

Discussion