はじめに
この記事は統計検定2級の取得を目指す方向けに構成されています。
問題の趣旨
3変数の確率変数の期待値と分散と相関係数に関する問題です。2ひねりから3ひねりくらいしていて、かつ2016年以前にこのような問題は出ていないので難しく感じます。
ですが、やっていることは基本の組み合わせです。
前提
標準化されたXi (i=1,2,3)とそれらの平均Yです。ここから
が成り立ちます。
問は、X1, Yの相関係数を求めます。2変数の相関係数ρは
ρ=\frac{cov(X1,Y)}{\sqrt{V(X1)V(Y)}}
ここまではたいていの人はたどり着きます。
解説
V(Y)の値を求めます。
V(Y)=V(\frac{X1+X2+X3}{3})
分散の性質
より、
V(Y)=\frac{1}{9}V(X1+X2+X3)
V(Y)=\frac{1}{9}(V(X1)+V(X2)+V(X3)+2cov(X1,X2)+2cov(X2,X3)+2cov(X3,X1))
標準化されていて、かつX1,X2,X3は無相関なので、
2cov(X1,X2)+2cov(X2,X3)+2cov(X3,X1) = 0
かつ標準化されているのですべての確率変数は1なので
V(Y)=\frac{1}{9}*(1+1+1) = \frac{1}{3}
次にcov(X1,Y)を考えます。公式より、
cov(X1,Y)=E[(X1-μ_{1})(Y-μ_{Y})]
標準化されているので、平均μはゼロですね。したがって
E(Y)=E(\frac{X1+X2+X3}{3}) = \frac{1}{3}(E(X1)+E(X2)+E(X3))
以上からE(X1Y)は整理すると
\frac{1}{3}(E(X1^2)+E(X1X2)+E(X1X3))
ここで、
E(X1)*E(X1) \neq (E(X1))^2
ですので注意です。
こちらが正解です。
ここまできてE(X1^2)ってどうやって計算するんだ?となった方が多いかと思われます。ここで使うのが、
この公式です。合格するだけなら、E(x^2)がきたらこの公式を用紙に書いておけばいいと思います。
前提より、E(X1)=0ですので、(E(X1))^2もゼロです。したがって
E(X1X2)やE(X1X3)は前提からゼロですね。これらををまとめると右辺はV(X1)しか残らないので、cov(X1,Y)は、
これで相関係数を計算する各パーツがそろいました。それぞれ数値を当てはめると、
ρ=\frac{cov(X1,Y)}{\sqrt{V(X1)V(Y)}}=\frac{\frac{1}{3}}{\sqrt{\frac{1}{3}}}=\sqrt{\frac{1}{3}}=0.577...
こちらが答えとなります。
Discussion
cov(X1,Y)を求める式の中段あたりにある、E(X1Y)=E(X1)∗E(Y)の部分ですが、E(X1)は、定義{E(Xi)=0}より、0になるではないでしょうか。