Zenn
🌊

統計検定1級 2013年 統計数理 問題2 解答例

2024/03/18に公開

はじめに

今回は統計検定1級より 2013年 統計数理 問題2 の解答を記載します。
正規分布の条件付き確率に関する問題です。
変数変換により、条件付き確率の計算を簡略化するのがポイントです。
問題については著作物のため割愛します。

前置き

条件付き確率の計算の簡略化について説明します。
互いに独立でない確率変数 X,YX,Y について、Y,g(X,Y)Y,g(X,Y) が独立であれば、Z=g(X,Y)Z=g(X,Y) として、( ggxx について単調増加または単調減少)

P(X=x,Y=y)=P(Z=g(x,y),Y=y)xz(=g(x,y))=P(Z=g(x,y))P(Y=y)1g(x,y)x\begin{aligned} P(X=x,Y=y) &=P(Z=g(x,y),Y=y)\left|\dfrac{\partial x}{\partial z \big(=g(x,y)\big)} \right|\\ &=P(Z=g(x,y))P(Y=y) \left|\dfrac{1}{\dfrac{\partial g(x,y)}{\partial x}} \right| \end{aligned}

が成り立ちます。
これを利用して、XY=yX|Y=y について、XXYY とは独立な確率変数 Z=g(X,Y)Z=g(X,Y) に変換した場合、確率関数は

P(X=xY=y)=P(X=x,Y=y)P(Y=y)=P(Z=g(x,y))P(Y=y)P(Y=y)1g(x,y)x=P(Z=g(x,y))1g(x,y)x\begin{aligned} P(X=x | Y=y) &=\dfrac{P(X=x , Y=y)}{P(Y=y)} \\ &=\dfrac{P(Z=g(x,y) )P( Y=y)}{P(Y=y)} \left|\dfrac{1}{\dfrac{\partial g(x,y)}{\partial x}} \right|\\ &=P(Z=g(x,y) ) \left|\dfrac{1}{\dfrac{\partial g(x,y)}{\partial x}} \right|\\ \end{aligned}

となり、計算を簡略化できる場合があります。

[1]

正規分布においては無相関と独立は同値である。
よって、Cov[Yn,XiYnn]=0Cov\left[Y_{n},X_{i}-\dfrac{Y_{n}}{n}\right]=0 を示せばよい。(i=1, ... ,n)(i=1,\ ...\ ,n)
まず、YnY_{n} の期待値、分散については

E[Yn]=E[X1++Xn]=nμV[Yn]=V[X1++Xn]=nσ2\begin{aligned} E[Y_{n}] &=E[X_{1}+\cdots+X_{n}]=n\mu\\ V[Y_{n}] &=V[X_{1}+\cdots+X_{n}]=n\sigma^{2} \end{aligned}

となる。よって、YnY_{n}XiYn/nX_{i} - Y_{n}/n の共分散は

Cov[Yn,XiYnn]=Cov[X1++Xn,Xi]1nCov[Yn,Yn]=Cov[Xi ,Xi]1nV[Yn]=V[Xi]1nV[Yn]=σ21nnσ2=0\begin{aligned} Cov\left[Y_{n},X_{i}-\dfrac{Y_{n}}{n}\right] &=Cov\left[X_{1}+\cdots+X_{n},X_{i}\right] -\dfrac{1}{n}Cov\left[Y_{n},Y_{n} \right]\\ &=Cov\left[X_{i}\ ,X_{i}\right] -\dfrac{1}{n}V\left[Y_{n}\right]\\ &=V\left[X_{i} \right] -\dfrac{1}{n}V\left[Y_{n}\right]\\ &=\sigma^{2} -\dfrac{1}{n}\cdot n\sigma^{2}\\ &=0 \end{aligned}

以上より、YnY_{n}X1YnnX_{1}-\dfrac{Y_{n}}{n} は独立である。

[2]

X1Yn=ynX_{1}|Y_{n}=y_{n} の分布について P(X1=x1Yn=yn)P(X_{1}=x_{1}|Y_{n}=y_{n}) を求めると、

P(X1=x1Yn=yn)=P(X1=x1,Yn=yn)P(Yn=yn)P(X_{1}=x_{1}|Y_{n} = y_{n} )=\dfrac{P(X_{1}=x_{1},Y_{n}=y_{n})}{P(Y_{n}=y_{n})}

となるが、X1X_{1}YnY_{n} は独立ではないため計算が複雑になる。

そこで、W1=X1YnnW_{1} = X_{1}-\dfrac{Y_{n}}{n} とし、X1X_{1}W1W_{1} に変換すると、[1]より W1,YnW_{1},Y_{n} は独立であるため、計算を簡略化することができる。

X1=x1,Yn=ynX_{1}=x_{1}, Y_{n} = y_{n} のとき、 W1=x1ynn, x1(x1ynn)=1W_{1} = x_{1} - \dfrac{y_{n}}{n},\ \left| \dfrac{\partial}{\partial x_{1}} \left(x_{1}-\dfrac{y_{n}}{n} \right) \right|=1 となることから、

P(X1=x1Yn=yn)=P(X1=x1,Yn=yn)P(Yn=yn)=P(W1=x1ynn,Yn=yn)P(Yn=yn)=P(W1=x1ynn)P(Yn=yn)P(Yn=yn)=P(W1=x1ynn)\begin{aligned} P(X_{1}=x_{1}|Y_{n} = y_{n} ) &=\dfrac{P(X_{1}=x_{1},Y_{n}=y_{n})}{P(Y_{n}=y_{n})} \\ &=\dfrac{P \left(W_{1}=x_{1}-\dfrac{y_{n}}{n} , Y_{n}=y_{n} \right)}{P(Y_{n}=y_{n})} \\ &=\dfrac{P \left(W_{1}=x_{1}-\dfrac{y_{n}}{n}\right) P(Y_{n}=y_{n} )}{P(Y_{n}=y_{n})} \\ &=P \left(W_{1}=x_{1}-\dfrac{y_{n}}{n}\right) \end{aligned}

W1W_{1} の分布は

E[W1]=E[X1]1nE[Yn]=σ1nnσ=0\begin{aligned} E[W_{1}] &=E[X_{1}]-\dfrac{1}{n}E[Y_{n}] \\ &=\sigma- \dfrac{1}{n} n\sigma \\ &= 0 \end{aligned}
V[W1]=V[X1Ynn]=V[n1nX11n(X2++Xn)]=1n2{(n1)2+(n1)}σ2=n1nσ2\begin{aligned} V[W_{1}] &=V\left[X_{1}-\dfrac{Y_{n}}{n} \right] \\ &=V\left[\dfrac{n-1}{n} X_{1} -\dfrac{1}{n}(X_{2}+\cdots+X_{n}) \right] \\ &=\dfrac{1}{n^{2}}\left\{ (n-1)^2 + (n-1) \right\}\sigma^{2} \\ &=\dfrac{n-1}{n}\sigma^{2} \\ \end{aligned}

よって、W1N(0,n1nσ2)W_{1} \sim N \left( 0,\dfrac{n-1}{n}\sigma^{2} \right)

ゆえに、X1Yn=ynX_{1} |Y_{n}=y_{n} の確率関数は、

P(X1=x1Yn=yn)=P(W1=x1ynn)=12πn1nσ2exp{w122n1nσ2}w1=x1yn/n=12πn1nσ2exp{(x1ynn)22n1nσ2}\begin{aligned} P(X_{1}=x_{1}|Y_{n} = y_{n} ) &=P \left(W_{1}=x_{1} -\dfrac{y_{n}}{n}\right) \\ &=\left. \dfrac{1}{\sqrt{2\pi\dfrac{n-1}{n}\sigma^{2}}} \exp\left\{ -\dfrac{w_{1}^{2}}{2\dfrac{n-1}{n}\sigma^{2}} \right\} \right|_{w_{1}=x_{1}-y_{n}/n} \\ &=\dfrac{1}{\sqrt{2\pi\dfrac{n-1}{n}\sigma^{2}}} \exp\left\{ -\dfrac{\left(x_{1}-\dfrac{y_{n}}{n} \right)^{2}}{2\dfrac{n-1}{n}\sigma^{2}} \right\} \end{aligned}

となる。以上より、

X1Yn=ynN(ynn,n1nσ2)X_{1}|Y_{n} = y_{n} \sim N\left(\dfrac{y_{n}}{n}, \dfrac{n-1}{n}\sigma^{2} \right)

[3]

[2]と同様に、Yk1Y_{k-1}YkY_k に独立な確率変数に変換することで、計算を簡略化する。
今回の場合は [1]より YkY_{k}XiYkk(i=1,,k)X_{i}-\dfrac{Y_{k}}{k} (i=1,\dots, k) が独立であることから、Yk1Y_{k-1}Wk=XkYkkW_{k}=X_{k} - \dfrac{Y_{k}}{k} に変換する。

Wk=XkYkk=YkYk1Ykk=k1kYkYk1W_{k}=X_{k} - \dfrac{Y_{k}}{k}=Y_{k}-Y_{k-1}-\dfrac{Y_{k}}{k}=\dfrac{k-1}{k}Y_{k}-Y_{k-1} と変形すると、

Yk1=yk1,Yk=ykY_{k-1}=y_{k-1},Y_{k}=y_{k} のとき、Wk=k1kykyk1,W_{k}=\dfrac{k-1}{k}y_{k}-y_{k-1}, yk1(k1kykyk1)=1\left| \dfrac{\partial}{\partial y_{k-1}} \left(\dfrac{k-1}{k}y_{k}-y_{k-1} \right) \right|=1 である。

ゆえに、Yk1Yk=ykY_{k-1}|Y_{k}=y_{k} の確率関数は

P(Yk1=yk1Yk=yk)=P(Yk1=yk1,Yk=yk)P(Yk=yk)=P(Wk=k1kykyk1,Yk=yk)P(Yk=yk)=P(Wk=k1kykyk1)P(Yk=yk)P(Yk=yk)=P(Wk=k1kykyk1)\begin{aligned} P(Y_{k-1}=y_{k-1}|Y_{k}=y_{k}) &=\dfrac{P(Y_{k-1}=y_{k-1},Y_{k}=y_{k})}{P(Y_{k}=y_{k})}\\ &=\dfrac{P\left(W_{k}=\dfrac{k-1}{k}y_{k}-y_{k-1},Y_{k}=y_{k} \right)} {P(Y_{k}=y_{k})}\\ &=\dfrac{P\left(W_{k}=\dfrac{k-1}{k}y_{k}-y_{k-1}\right) P(Y_{k}=y_{k} )} {P(Y_{k}=y_{k})}\\ &=P\left(W_{k}=\dfrac{k-1}{k}y_{k}-y_{k-1}\right) \\ \end{aligned}

[3] の W1W_{1} と同様にして WkN(0,k1kσ2)W_{k} \sim N\left(0,\dfrac{k-1}{k}\sigma^{2} \right) である。
よって、

Yk1Yk=yk N(k1kyk,k1kσ2)Y_{k-1}|Y_{k}=y_{k}\ \sim N\left( \dfrac{k-1}{k}y_{k}, \dfrac{k-1}{k}\sigma^{2} \right)

[4]

今回は Yk1Y_{k-1} を残し、YkY_{k}Xk=YkYk1X_{k}=Y_{k}-Y_{k-1} に変換する。また、yk(ykyk1)=1\left| \dfrac{\partial}{\partial y_{k}} \left(y_{k}-y_{k-1} \right) \right|=1 である。
fk1(yk1yk)f_{k-1}(y_{k-1}|y_{k}) については、

fk1(yk1yk)=P(Yk1=yk1,Yk=yk)P(Yk=yk)=P(Yk1=yk1,Xk=ykyk1)P(Yk=yk)=P(Yk1=yk1)P(Xk=ykyk1)P(Yk=yk)\begin{aligned} f_{k-1}(y_{k-1}|y_{k}) &=\dfrac{P(Y_{k-1}=y_{k-1},Y_{k}=y_{k})}{P(Y_{k}=y_{k})}\\ &=\dfrac{P(Y_{k-1}=y_{k-1},X_{k}=y_{k}-y_{k-1})}{P(Y_{k}=y_{k})}\\ &=\dfrac{P(Y_{k-1}=y_{k-1})P(X_{k}=y_{k}-y_{k-1})}{P(Y_{k}=y_{k})}\\ \end{aligned}

となる。また、gn(yn)g_{n}(y_{n}) については以下のように表せる。

gn(yn)=P(Yn=yn)g_{n}(y_{n})=P(Y_{n}=y_{n})

ゆえに、

{k=2nfk1(yk1yk)}gn(yn)=P(Y1=y1)P(X2=y2y1)P(Y2=y2)P(Y2=y2)P(X3=y3y2)P(Y3=y3)P(Yn1=yn1)P(Xn=ynyn1)P(Yn=yn)P(Yn=yn)=P(Y1=y1){k=2nP(Xk=ykyk1)}\begin{aligned} \Bigg\{ \prod_{k=2}^{n} & f_{k-1}(y_{k-1}|y_{k}) \Bigg\} g_{n}(y_{n})\\ &=\dfrac{P(Y_{1}=y_{1})P(X_{2}=y_{2}-y_{1})}{P(Y_{2}=y_{2})} \dfrac{P(Y_{2}=y_{2})P(X_{3}=y_{3}-y_{2})}{P(Y_{3}=y_{3})} \cdots \dfrac{P(Y_{n-1}=y_{n-1})P(X_{n}=y_{n}-y_{n-1})}{P(Y_{n}=y_{n})} P(Y_{n}=y_{n}) \\ &= P(Y_{1}=y_{1}) \left\{ \prod_{k=2}^{n} P(X_{k}=y_{k}-y_{k-1}) \right\} \end{aligned}

ここで、Y1=X1,y1=x1,ykyk1=xk(k=2,  ,n)Y_{1}=X_{1},y_{1}=x_{1},y_{k}-y_{k-1}=x_{k}(k=2,\ \dots\ ,n) と置き換えれば、

{k=2nfk1(yk1yk)}gn(yn)={k=1nP(Xk=xk)}\begin{aligned} \Bigg\{ \prod_{k=2}^{n} & f_{k-1}(y_{k-1}|y_{k}) \Bigg\} g_{n}(y_{n}) = \left\{ \prod_{k=1}^{n} P(X_{k}=x_{k}) \right\} \end{aligned}

となる。以上より、{k=2nfk1(yk1yk)}gn(yn)\left\{ \prod_{k=2}^{n} f_{k-1}(y_{k-1}|y_{k}) \right\} g_{n}(y_{n})X1, , XnX_{1},\ \dots,\ X_{n} の同時分布の確率密度関数となる。

Discussion

ログインするとコメントできます