Zenn
📝

現代数理統計学の基礎 確認テスト発展編 解説

2024/12/01に公開

0. 背景

統計検定 1 級の勉強の対策の一環として、現代数理統計学の基礎という参考書を勉強していた。この参考書には著者のサポートサイトが存在し、章末問題の解答や補足・訂正がある。また、著者は大学で統計学の基礎の講義をしており、その際のテスト問題 (基礎編・発展編) も掲載されている。このテスト問題にも著者の解答がついているものの、解法に至る思考プロセスや解法の難しさの観点でやや難解なものがいくつか存在すると自分は考えている。本書は統計検定 1 級の参考書として有名であり、著者以外にも解説を Blog にまとめている方は何人かいるものの、発展編の解説記事を執筆している方は (自分の見た限りでは) あまりいなかった。そこで本記事は、発展編のテストの解説記事を読者の理解を助けるためと自らの統計学の基礎的な部分に対する理解を深めるために記しておく。誤り等がいくつかあるかもしれないので、都度指摘していただけると幸いだ。

1. 解答

問 1

(1)(1) 連続型確率関数の定義から、定義される全区間の確率関数の積分が 1 となれば良く、

fX(x)dx=11C(1x)dx=2C01(1x)dx(被積分関数は偶関数)=2C[x12x2]=C=1, \begin{align} \int_{-\infty}^{\infty} f_X(x) dx &= \int_{-1}^{1} C(1-|x|) dx \notag\\ &= 2C \int_{0}^{1} (1-x) dx\hspace{3mm}(\because 被積分関数は偶関数) \notag \\ &= 2C \left[ x - \dfrac{1}{2}x^2\right] \notag \\ &= C = 1, \end{align}

以上より C=1C = 1

(2)(2) 連続型確率変数の変数変換は分布関数の変換を行った後、該当の変数で微分すれば良い。また、YYの範囲は Y=XY = |X|であることより、Y0Y \geq 0 。このことに注意した上で YY の確率密度関数 fY(y)f_Y(y)、分布関数 FY(y)F_Y(y) として、

(a)0y<1(a)\hspace{1mm} 0 \leq y < 1 のとき

FY(y)=P(Yy)=P(Xy)=P(yXy)=yyfX(x)dx=20yfX(x)dx \begin{align} F_Y(y) &= P(Y \leq y) \notag \\ &= P(|X| \leq y) \notag \\ &= P(-y \leq X \leq y) \notag \\ &= \int_{-y}^{y} f_X(x) dx \notag \\ &= 2 \int_0^y f_X(x) dx \end{align}
fY(y)=ddyFY(y)=2fX(y)=2(1y). \begin{align} \therefore f_Y(y) &= \dfrac{d}{dy}F_Y(y) \notag \\ &= 2f_X(y) \notag \\ &= 2(1-y). \end{align}

(b)y1(b)\hspace{1mm} y \geq 1 のとき fY(y)=0.f_Y(y) = 0.

以上より、YYの確率密度関数は

{2(1y)(0y<1)0(y1) \begin{equation} \left\{ \begin{aligned} &2(1-y) \hspace{3mm}&(0 \leq y<1) \\ &0 \hspace{3mm}&(y \geq 1) \notag \end{aligned} \right. \end{equation}

(3)(2)(3)\hspace{1mm}(2) と同様に考えると、Z=X2Z=X^2 より Z0Z \geq 0 であることに注意し ZZ の確率密度関数 fZ(z)f_Z(z)、分布関数 FZ(z)F_Z(z) として、

(a)0z<1(a)\hspace{1mm} 0 \leq z < 1 のとき

FZ(z)=P(Zz)=P(X2z)=P(zXz)=zzfX(x)dx=20zfX(x)dx, \begin{align} F_Z(z) &= P(Z \leq z) \notag \\ &= P(X^2 \leq z) \notag \\ &= P(-\sqrt{z} \leq X \leq \sqrt{z}) \notag \\ &= \int_{-\sqrt{z}}^{\sqrt{z}}f_X(x) dx \notag \\ &= 2\int_{0}^{\sqrt{z}} f_X(x) dx, \end{align}
fZ(z)=ddzFZ(z)=2(12z)fX(z)=1z(1z). \begin{align} f_Z(z) &= \dfrac{d}{dz} F_Z(z) \notag \\ &= 2\cdot\left(\dfrac{1}{2\sqrt{z}}\right)f_X(\sqrt{z}) \notag \\ &= \dfrac{1}{\sqrt{z}}(1-\sqrt{z}). \end{align}

(b)z1(b)\hspace{1mm} z \geq 1 のとき fZ(z)=0f_Z(z) = 0 .

以上より、ZZの確率密度関数は

{1z(1z)(0z<1)0(z1) \begin{equation} \left\{ \begin{aligned} &\dfrac{1}{\sqrt{z}}(1-\sqrt{z}) \hspace{3mm}&(0 \leq z<1) \\ &0 \hspace{3mm}&(z \geq 1) \notag \end{aligned} \right. \end{equation}

問 2

(1)(1) 条件付き確率関数の期待値・分散の公式を用いると、

期待値は

E[X]=EY[EX[XY=y]]=EY[μ](XY=yN(μ,y))=μ, \begin{align} E[X] &= E^Y[E^X[X|Y=y]] \notag \\ &= E^Y[\mu] \hspace{3mm} (\because X|Y=y \sim N(\mu, y))\notag \\ &=\mu, \\ \end{align}

分散は

Var(X)=VarY(EX[XY=y])+EY(VarX[XY=y])=VarY(μ)+EY(y)=fY(y)dy=01Γ(α)(1β)αxα1ex/βdx=1Γ(α)0βsα1esds(s=x/β)=βΓ(α+1)Γ(α)=αβ, \begin{align} {\rm{Var}}(X) &= {\rm{Var}}^Y(E^X[X|Y=y]) + E^Y({\rm{Var}}^X[X|Y=y]) \notag \\ &= {\rm{Var}}^Y(\mu) + E^Y(y) \notag \\ &= \int_{-\infty}^{\infty} f_Y(y) dy \notag \\ &= \int_0^{\infty} \dfrac{1}{\Gamma(\alpha)}\left(\dfrac{1}{\beta}\right)^{\alpha}x^{\alpha-1}e^{-x/\beta}dx \notag \\ &= \dfrac{1}{\Gamma(\alpha)} \int_0^\infty \beta s^{\alpha-1}e^{-s} ds \hspace{3mm}(s=x/\beta) \notag \\ &= \dfrac{\beta \Gamma(\alpha + 1)}{\Gamma(\alpha)} \notag \\ &= \alpha\beta, \end{align}

なお、上記の式では、ガンマ分布の確率密度関数を

fZ(z)={1Γ(α)(1β)αzα1ez/β(z0)0(z<0) \begin{equation} f_Z(z) = \left\{ \begin{aligned} &\dfrac{1}{\Gamma(\alpha)}(\dfrac{1}{\beta})^\alpha z^{\alpha-1}e^{-z/\beta} &(z \geq0) \\ &0 &(z < 0) \end{aligned} \right. \end{equation}

と定義している。なお、ガンマ関数は

Γ(α)=0tα1etdt. \begin{align} \Gamma(\alpha) = \int_{0}^{\infty} t^{\alpha-1}e^{-t}dt. \end{align}

さらに、E[(Xμ)4]E[(X- \mu)^4] も同様に条件付き期待値を考えて

E[(Xμ)4]=EY[EX[(Xμ)4Y=y]] \begin{align} E[(X-\mu)^4] &= E^Y[E^X[(X-\mu)^4|Y=y]] \end{align}

ここで、Z=XμZ = X-\mu とすると、ZY=yN(0,y)Z|Y=y \sim N(0, y) だから、

E[Z4Y=y]=z412πyexp(12yz2)dz=[y2πyz3exp(12yz2)]+3z22πyexp(12yz2)dz=3{[y22πyexp(12yz2)]+y22πyexp(12yz2)dz}=3y2(12πyexp(12yz2)=1.) \begin{align} E[Z^4|Y=y] &= \int_{-\infty}^{\infty} z^4 \cdot \dfrac{1}{\sqrt{2\pi y}} \exp\left(-\dfrac{1}{2y}z^2\right) dz \notag \\ &= \left[-\dfrac{y}{\sqrt{2\pi y}}z^3 \exp\left(-\dfrac{1}{2y}z^2\right)\right]_{-\infty}^{\infty} + 3 \int_{-\infty}^{\infty}\dfrac{z^2}{\sqrt{2\pi y}} \exp\left(-\dfrac{1}{2y}z^2\right) dz \notag \\ &= 3\left\{ \left[-\dfrac{y^2}{\sqrt{2\pi y}}\exp\left(-\dfrac{1}{2y}z^2\right)\right]_{-\infty}^{\infty} + \int_{-\infty}^{\infty} \dfrac{y^2}{\sqrt{2\pi y}}\exp\left(-\dfrac{1}{2y}z^2\right) dz \right\} \notag \\ &= 3y^2 \\ &\left(\because \int_{-\infty}^{\infty} \dfrac{1}{\sqrt{2\pi y}}\exp\left(-\dfrac{1}{2y}z^2\right) = 1.\right) \notag \end{align}

よって、

EY[3Y2]=03y21Γ(α)(1β)αyα1ey/βdy=3Γ(α)0(1β)αyα+1ey/βdy=3Γ(α)0β2sα+1esds(s=y/β)=3β2Γ(α+2)Γ(α)=3β2(α+1)α. \begin{align} E^Y[3Y^2] &= \int_0^{\infty} 3y^2\cdot \dfrac{1}{\Gamma(\alpha)}\left(\dfrac{1}{\beta}\right)^{\alpha}y^{\alpha-1}e^{-y/\beta}dy \notag \\ &= \dfrac{3}{\Gamma(\alpha)}\int_{0}^{\infty}\left(\dfrac{1}{\beta}\right)^{\alpha}y^{\alpha+1}e^{-y/\beta}dy \notag \\ &= \dfrac{3}{\Gamma(\alpha)}\int_0^{\infty}\beta^2 s^{\alpha + 1}e^{-s} ds\hspace{3mm}(s= y/\beta) \notag \\ &= \dfrac{3\beta^2\Gamma(\alpha+2)}{\Gamma(\alpha)} \notag \\ &= 3\beta^2(\alpha + 1)\alpha. \end{align}

(2)(2) Z=XμZ = X- \mu とおくとき、(1)(1) から ZY=yN(0,y)Z|Y=y \sim N(0, y) だから、

MZ(t)=E[etZ]=EY[EZ[etZY=y]], \begin{align} M_Z(t) &= E[e^{tZ}] \notag \\ &= E^Y[E^Z[e^{tZ}|Y=y]], \\ \end{align}
EZ[etZY=y]=0exp(tz)12πyexp(12yz2)dz=012πyexp{12y(zty)2+t2y2}dz=exp(t2y2), \begin{align} E^Z[e^{tZ}|Y=y] &= \int_0^{\infty} \exp{(tz)} \cdot \dfrac{1}{\sqrt{2\pi y}} \exp\left(-\dfrac{1}{2y}z^2\right) dz \notag \\ &= \int_0^\infty \dfrac{1}{\sqrt{2\pi y}} \exp{\left\{ -\dfrac{1}{2y}\left( z-ty \right)^2 + \dfrac{t^2y}{2} \right\}}\hspace{1mm}dz \notag \\ &= \exp{\left(\dfrac{t^2y}{2}\right)}, \end{align}
 MZ(t)=EY[et2Y/2]=0et2y/21Γ(α)(1β)αyα1ey/βdy=01Γ(α)yα1(1β)αexp{(1βt22)y}dy=(1β)α{(1βt22)}α=(1βt22)α. \begin{align} \ \therefore M_Z(t) &= E^Y\left[e^{t^2Y/2}\right] \notag \\ &= \int_0^\infty e^{t^2y/2}\cdot \dfrac{1}{\Gamma(\alpha)}\left(\dfrac{1}{\beta}\right)^{\alpha}y^{\alpha-1}e^{-y/\beta}dy \notag \\ &= \int_0^\infty \dfrac{1}{\Gamma(\alpha)}\cdot y^{\alpha-1}\left(\dfrac{1}{\beta}\right)^\alpha \exp{\left\{-\left( \dfrac{1}{\beta} - \dfrac {t^2}{2} \right)y \right\}}dy \notag \\ &= \left(\dfrac{1}{\beta}\right)^\alpha \left\{\left( \dfrac{1}{\beta} - \dfrac {t^2}{2} \right) \right\}^{-\alpha} \notag \\ &= \left(1 - \dfrac{\beta t^2}{2}\right)^{-\alpha}. \end{align}

(3)(3) (2)(2) の積率母関数の収束値を考えれば良い。β=1/α\beta = 1/\alpha であるので、

limα(1βt22)α=limα(1t22α)α=limα{(1t22α)2αt2}t22=exp(t22)(limn(1+1n)n=e) \begin{align} \lim_{\alpha \to \infty} \left(1 - \dfrac{\beta t^2}{2}\right)^{-\alpha} &= \lim_{\alpha \to \infty} \left( 1 - \dfrac{t^2}{2\alpha} \right)^{-\alpha} \notag \\ &= \lim_{\alpha \to \infty} \left\{ \left(1 - \dfrac{t^2}{2\alpha}\right)^{-\frac{2\alpha}{t^2}} \right\}^{\frac{t^2}{2}} \notag \\ &= \exp{\left(\dfrac{t^2}{2}\right)}\hspace{3mm}\left( \because \lim_{n \to \infty} \left(1+\dfrac{1}{n}\right)^{n} = e\right) \end{align}

これは標準正規分布の積率母関数だから、連続性定理から ZZ は標準正規分布に従う。

(4)(4) W=(Xμ)2/YW = (X-\mu)^2 / Y とおくとき、

Cov(W,Y)=E[(Xμ)2YY]E[(Xμ)2Y]E[Y]=Var(X)EY[EX[(Xμ)2YY=y]]E[Y]=αβEY[YY]E[Y](VX[XY=y]=y)=αβαβ=0.(E[Y]=αβ) \begin{align} {\rm{Cov}}(W,Y) &= E\left[\dfrac{(X-\mu)^2}{Y}\cdot Y\right] - E\left[\dfrac{(X-\mu)^2}{Y}\right]E[Y] \notag \\ &= {\rm{Var}}(X) - E^Y\left[ E^X\left[ \dfrac{(X-\mu)^2}{Y}\left| Y=y\right. \right] \right]E[Y] \notag \\ &= \alpha\beta - E^Y\left[ \dfrac{Y}{Y} \right] E[Y] \hspace{3mm}(\because V^X[X|Y=y]=y)\notag \\ &= \alpha\beta - \alpha\beta \notag \\ &= 0. \hspace{3mm}(\because E[Y] = \alpha\beta) \end{align}

問 3

(1)(1) (X,Y)=(Rcosθ,Rsinθ)(X, Y) = (R\cos \theta, R\sin\theta) なる極座標変換を行った時、変数変換のヤコビアンは

(X,Y)(R,θ)=det(cosθRsinθsinθRcosθ)=R, \begin{align} \dfrac{\partial (X, Y)}{\partial (R, \theta)} &= \det \begin{pmatrix} \cos\theta &-R\sin\theta \\ \sin\theta &R\cos\theta \end{pmatrix} = R, \end{align}

だから、(R,θ)(R, \theta) に関する確率密度関数は

fR,θ(R,θ)=fX,Y(X,Y)R=fX,Y(Rcosθ,Rsinθ)=Ch(R2), \begin{align} f_{R,\theta}(R, \theta) &= f_{X, Y} (X, Y) R \notag \\ &= f_{X, Y} (R\cos\theta, R\sin\theta) \notag \\ &= C \cdot h(R^2), \end{align}

となる。また、正規化定数 CCfR,θ(R,θ)f_{R,\theta}(R, \theta) が確率密度関数であることから

02π0fR,θ(R,θ)dRdθ=C02πdθ0Rh(R2)dR=Cπ0h(s)ds(s=R2,ds=2RdR)=1,C=1π \begin{align} \int_{0}^{2\pi}\int_{0}^{\infty} f_{R, \theta} (R, \theta) dR \hspace{1mm}d\theta &= C \int_0^{2\pi}d\theta \int_0^{\infty} R\cdot h(R^2) dR \notag \\ &=C \cdot \pi \int_0^{\infty} h(s) ds \hspace{3mm}(s=R^2, ds = 2RdR) \notag \\ &= 1, \\ \therefore C &= \dfrac{1}{\pi} \end{align}

また、変数変換を利用すれば

E[X2X2+Y2]=E[R2cos2θR2]=E[cos2θ]. \begin{align} E\left[\dfrac{X^2}{X^2+Y^2}\right] &= E\left[\dfrac{R^2\cos^2\theta}{R^2}\right] = E[\cos^2 \theta]. \end{align}

ここで、θ\theta は式 (20)(20) の途中式から一様分布 fθ(θ)=12πf_\theta(\theta) = \dfrac{1}{2\pi} に従うので、

E[cos2θ]=12π02πcos2θdθ=12π02π1+cos2θ2dθ=14π[θ+12sin2θ]02π=12. \begin{align} E[\cos^2 \theta] &= \dfrac{1}{2\pi}\int_0^{2\pi} \cos^2 \theta d\theta \notag \\ &= \dfrac{1}{2\pi}\int_0^{2\pi} \dfrac{1+\cos2\theta}{2} d\theta \notag \\ &= \dfrac{1}{4\pi}\left[ \theta + \dfrac{1}{2}\sin 2\theta \right]_{0}^{2\pi} \notag \\ &= \dfrac{1}{2}. \end{align}

(2)(2) (1)(1) と同様に変数変換を行えば良い。ただし、A={(x,y)0<x<,0<y<}A = \{(x, y) | 0 < x < \infty, 0 < y < \infty \} であることより、極座標変換後の定義域は 0<R<,0<θ<π/20 < R < \infty, 0 < \theta < \pi/2 となる。このことに注意して正規化定数 CC を求めると、

0dR0π2dθCRh(R2)=π4C=1,C=4π. \begin{align} \int_0^{\infty} dR\int_0^{\frac{\pi}{2}} d\theta \hspace{1mm} C\cdot Rh(R^2) &= \dfrac{\pi}{4}\cdot C = 1, \\ \therefore C &= \dfrac{4}{\pi}. \end{align}

(3)(3) ρ\rho の条件は fR,θ(R,θ)f_{R, \theta} (R, \theta) が確率密度関数になる必要があるので収束する必要がある。ここで ρ21\rho^2 \geq 1 であるときに h()h(\cdot) が単調減少関数であることから

Ch((x+ρy)2+(1ρ2)y2)dxdyCh((x+ρy)2)dxdy=Ch(s2)dsdy \begin{align} &\int_{-\infty}^{\infty}\int_{- \infty}^{\infty} C\cdot h((x+\rho y)^2 + (1-\rho^2)y^2) dxdy \notag \\ &\geq \int_{-\infty}^{\infty}\int_{-\infty}^{\infty} C\cdot h((x+\rho y)^2) dxdy \notag \\ &= \int_{-\infty}^{\infty} C\cdot h(s^2) ds \int_{-\infty}^{\infty}dy \end{align}

と不等式で評価でき、右辺は発散することから存在しない。ゆえに ρ<1|\rho| < 1

また、x2+2ρxy+y2=(x+ρy)2+(1ρ2)y2x^2 + 2\rho xy + y^2 = (x+\rho y)^2 + (1 - \rho^2)y^2 と平方完成できることから、

{X+ρY=Rcosθ1ρ2Y=Rsinθ \begin{equation} \left\{ \begin{aligned} X+ \rho Y & = R\cos \theta \\ \sqrt{1-\rho^2}Y &= R \sin \theta \end{aligned} \right. \end{equation}

という変数変換を考えると、ヤコビアンは

(X,Y)(R,θ)=(cosθ(ρ/1ρ2)sinθR(sinθ+ρ/1ρ2cosθ)(1/1ρ2)sinθ(ρ/1ρ2)sinθR/1ρ2cosθ)=(R/1ρ2)cos2θRρ/(1ρ2)sinθcosθ+(R/1ρ2)sin2θ+Rρ/(1ρ2)sinθcosθ=R/1ρ2, \begin{align} \dfrac{\partial (X, Y)}{\partial (R, \theta )} &= \begin{pmatrix} \cos \theta-(\rho/\sqrt{1-\rho^2})\sin \theta &-R(\sin\theta + \rho/\sqrt{1-\rho^2}\cos\theta) \\ (1/\sqrt{1-\rho^2})\sin \theta-(\rho/\sqrt{1-\rho^2})\sin \theta &R/\sqrt{1-\rho^2}\cos\theta \end{pmatrix} \notag \\ &= (R/\sqrt{1-\rho^2})\cos^2 \theta - R\rho/(1-\rho^2)\cdot \sin\theta\cos\theta \notag \\ &+ (R/\sqrt{1-\rho^2})\sin^2 \theta + R\rho/(1-\rho^2)\cdot \sin\theta\cos\theta \notag \\ &= R/\sqrt{1-\rho^2}, \end{align}

だから、fR,θ(R,θ)=CR/1ρ2h(R2)f_{R, \theta}(R, \theta) = C\cdot R/\sqrt{1-\rho^2} h(R^2) となる。また、正規化定数 CC の値は (1)(1) と同様に考えて、

0dR02πdθCR/1ρ2h(R2)=C2π1ρ212=Cπ1ρ2=1,C=1ρ2π \begin{align} \int_0^{\infty} dR \int_0^{2\pi} d\theta\hspace{1mm} C\cdot R/\sqrt{1-\rho^2} h(R^2) &= C\cdot \dfrac{2\pi}{\sqrt{1-\rho^2}}\cdot \dfrac{1}{2} \notag \\ &= \dfrac{C\pi}{\sqrt{1-\rho^2}} = 1,\\ \therefore C &= \dfrac{\sqrt{1-\rho^2}}{\pi} \end{align}

問 4

求める分布の積率母関数を考える。積率母関数を M(t)M(t) として

M(t)=E[en3/4(Xˉp)t] \begin{align} M(t) &= E[e^{n^{3/4}(\bar{X}-p)t}] \end{align}

ここで、S=i=1nXi\displaystyle S = \sum_{i=1}^{n} X_i とおくと Xˉ=S/n\bar{X} = S/n であることより、

M(t)=E[e(t/n1/4S)e4n1/4t](p=4/n)=e4n1/4tE[e(t/n1/4S)]. \begin{align} M(t) &= E[e^{(t/n^{1/4}S)}\cdot e^{-4n^{1/4}t}] \hspace{3mm}(\because p= 4/ \sqrt{n}) \notag \\ &= e^{-4n^{1/4}t}\cdot E[e^{(t/n^{1/4}S)}]. \end{align}

また、X1,Xn,i.i.dBer(p)X_1, \cdots X_n, {\rm{i.i.d}} \sim Ber(p) だから、

E[e(t/n1/4S)]={x=01et/n1/4xpx(1p)1x}n={e(t/n1/4)(4/n)+(14/n)}n, \begin{align} E[e^{(t/n^{1/4}S)}] &= \left\{ \sum_{x=0}^{1}e^{t/n^{1/4}x}\cdot p^x(1-p)^{1-x} \right\}^{n} \notag \\ &= \left\{ e^{(t/n^{1/4})}\cdot(4/\sqrt{n})+(1-4/{\sqrt{n}}) \right\}^n, \end{align}

と書ける。ここで、上式で指数関数の Taylor 展開より、

et/n1/4=1+tn1/4+12(tn1/4)2+o(n1) \begin{align} e^{t/n^{1/4}} &= 1 + \dfrac{t}{n^{1/4}} + \dfrac{1}{2}\left( \dfrac{t}{n^{1/4}} \right)^2 + o(n^{-1}) \end{align}

と近似できるから、

E[et/n1/4S]={4n+4tn3/4+2t2n+0(n1)+14n}n=(1+4tn3/4+2t2n+o(n1))n, \begin{align} E[e^{t/n^{1/4}S}] &= \left\{ \dfrac{4}{\sqrt{n}} + \dfrac{4t}{n^{3/4}} + \dfrac{2t^2}{n} + 0(n^{-1}) + 1 - \dfrac{4}{\sqrt{n}} \right\}^n \notag \\ &= \left( 1+\dfrac{4t}{n^{3/4}} + \dfrac{2t^2}{n} + o(n^{-1}) \right)^n, \end{align}

さらに、M(t)M(t) に対して自然対数を底とする対数を取ると、

logM(t)=4n1/4t+nlog{1+4tn3/4+2t2n+o(n1)} 4n1/4t+n(4tn3/4+2t2n+o(n1))(log(1+x)x)=2t2+o(1), \begin{align} \log M(t) &= -4n^{1/4}t + n\log\left\{ 1+\dfrac{4t}{n^{3/4}} + \dfrac{2t^2}{n} + o(n^{-1}) \right\} \notag \\ &\simeq -4n^{1/4}t + n \left( \dfrac{4t}{n^{3/4}} + \dfrac{2t^2}{n} + o(n^{-1}) \right)\hspace{3mm}(\because \log(1+x) \simeq x) \notag \\ &= 2t^2 + o(1), \end{align}

と近似できる。したがって、M(t)e2t2=e(2)2t2/2M(t) \to e^{2t^2} = e^{(2)^2t^2/2} なので、N(0,4)N(0,4) の積率母関数に一致する。ゆえに、

n3/4(Xˉp)dN(0,4). \begin{align} n^{3/4}(\bar{X}-p) \to {}_dN(0,4). \end{align}

問 5

VX2=1n1i=1n(XiXˉ)2=1n1i=1n{(Xiμ)(Xˉμ)}2=1n1i=1n{(Xiμ)22(Xˉμ)(Xiμ)+(Xˉμ)2}=1n1{i=1n(Xiμ)22(Xˉμ)i=1n(Xiμ)+n(Xˉμ)2}=1n1{i=1n(Xiμ)2n(Xˉμ)2}, \begin{align} V_X^2 &= \dfrac{1}{n-1}\sum_{i=1}^n(X_i - \bar{X})^2 \notag \\ &= \dfrac{1}{n-1}\sum_{i=1}^n \{(X_i - \mu) - (\bar{X}-\mu)\}^2 \notag \\ &=\dfrac{1}{n-1}\sum_{i=1}^{n}\{ (X_i-\mu)^2 - 2(\bar{X}-\mu)(X_i-\mu) + (\bar{X}-\mu)^2 \} \notag \\ &= \dfrac{1}{n-1}\left\{ \sum_{i=1}^n (X_i - \mu)^2 - 2(\bar{X}-\mu)\sum_{i=1}^{n} (X_i - \mu) + n(\bar{X}-\mu)^2 \right\} \notag \\ &= \dfrac{1}{n-1}\left\{ \sum_{i=1}^n(X_i - \mu)^2 - n(\bar{X}-\mu)^2\right\}, \end{align}

と変形でき、n(Xˉμ)dN(0,σ2)\sqrt{n}(\bar{X}-\mu) \to {}_dN(0, \sigma^2) であることから与式を変形して

n(VX2σ2)=nn1n{1ni=1n(Xiμ)2σ2}nn1n(Xˉμ)2+nn1σ2 \begin{align} \sqrt{n}(V_X^2 - \sigma^2) &= \dfrac{n}{n-1}\cdot \sqrt{n}\cdot \left\{ \dfrac{1}{n}\sum_{i=1}^n (X_i - \mu)^2 - \sigma^2 \right\} \notag \\ &- \dfrac{n}{n-1}\cdot \sqrt{n}\cdot (\bar{X}-\mu)^2 + \dfrac{\sqrt{n}}{n-1}\sigma^2 \end{align}

と表せる。ここで、Xˉμp0\bar{X} - \mu \to {}_p0 だからスラツキーの定理より、n(Xˉμ)2d0\sqrt{n}(\bar{X}-\mu)^2 \to {}_d 0 となる。また、これは n(Xˉμ)p0\sqrt{n}(\bar{X}-\mu) \to {}_p 0 でもある。

また、(Xiμ)2(X_i - \mu)^2 は期待値 E[(Xiμ)2]=σ2E[(X_i-\mu)^2] = \sigma^2、 分散 Var((Xiμ)2)=E[(Xiμ)4]E[(Xiμ)2]2{\rm{Var}}((X_i-\mu)^2) = E[(X_i - \mu)^4] - E[(X_i - \mu)^2]^2 であり、

E[(Xiμ)4]=(xμ)412πσ2exp{12σ2(xμ)2}dx=s412πσ2exp{12σ2s2}ds(s=xμ)=[σ212πσ2s3exp{12σ2s2}]+3σ2s212πσ2exp{12σ2s2}ds=3σ4 \begin{align} E[(X_i-\mu)^4] &= \int_{-\infty}^{\infty}(x-\mu)^4\cdot \dfrac{1}{\sqrt{2\pi\sigma^2}}\exp{\left\{ -\dfrac{1}{2\sigma^2}(x-\mu)^2 \right\}} dx \notag \\ &= \int_{-\infty}^{\infty} s^4\cdot \dfrac{1}{\sqrt{2\pi\sigma^2}}\exp{\left\{ -\dfrac{1}{2\sigma^2}s^2 \right\}} ds\hspace{3mm}(s=x-\mu) \notag \\ &= \left[ -\sigma^2 \cdot \dfrac{1}{\sqrt{2\pi\sigma^2}}\cdot s^3 \exp{\left\{ -\dfrac{1}{2\sigma^2}s^2 \right\}} \right]_{-\infty}^{\infty} \notag \\ &+ 3\sigma^2 \int_{-\infty}^{\infty} s^2\cdot \dfrac{1}{\sqrt{2\pi\sigma^2}}\exp{\left\{ -\dfrac{1}{2\sigma^2}s^2 \right\}} ds \notag \\ &= 3\sigma^4 \end{align}

より、Var((Xiμ)2)=3σ4σ4=2σ4{\rm{Var}}((X_i-\mu)^2) = 3\sigma^4 - \sigma^4 = 2\sigma^4 。ゆえに中心極限定理より

n{1ni=1n(Xiμ)2σ2}dN(0,2σ2), \begin{align} \sqrt{n}\left\{ \dfrac{1}{n}\cdot \sum_{i=1}^n (X_i - \mu)^2 - \sigma^2 \right\} \to {}_d N(0, 2\sigma^2), \end{align}

となるので、スラツキーの定理より n(VX2σ2)dN(0,2σ2)\sqrt{n}(V_X^2 - \sigma^2) \to {}_dN(0, 2\sigma^2)

次に n(F1)\sqrt{n}(F-1) を考える。ここで先ほど求めた式 n(VX2σ2)\sqrt{n}(V_X^2 - \sigma^2) が使える形に与式を変形するために、VX2,VY2V_X^2, \hspace{1mm}V_Y^2 を因数分解すると、

n(F1)=n(VX2VY21)=n((VX2σ2)(1VY21σ2)+VX2σ2+σ2VY22n)=n(VX2σ2)(1VY21σ2)+n(VX2σ21)+n(σ2VY21), \begin{align} \sqrt{n}(F-1) &= \sqrt{n}\left( \dfrac{V_X^2}{V_Y^2}-1 \right) \notag \\ &= \sqrt{n}\left( (V_X^2 - \sigma^2)\left(\dfrac{1}{V_Y^2} - \dfrac{1}{\sigma^2}\right) + \dfrac{V_X^2}{\sigma^2} + \dfrac{\sigma^2}{V_Y^2} - 2\sqrt{n} \right) \notag \\ &= \sqrt{n}(V_X^2 - \sigma^2)\left(\dfrac{1}{V_Y^2}-\dfrac{1}{\sigma^2}\right) + \sqrt{n}\left(\dfrac{V_X^2}{\sigma^2} - 1\right) + \sqrt{n}\left(\dfrac{\sigma^2}{V_Y^2} - 1\right), \end{align}

と分解できる。$\sqrt{n}(V_X^2 - \sigma^2) \to {}_d N(0, 2\sigma^4),\hspace{1mm}
\sqrt{n}(V_Y^2 - \sigma^2) \to {}_d N(0, 2\sigma^4)$ であり、VY2pσ2V_Y^2 \to {}_p \sigma^2 であることを用いて、スラツキーの定理より、

n(VX2σ2)(1VY21σ2)d0, \begin{align} \sqrt{n}(V_X^2 - \sigma^2)\left( \dfrac{1}{V_Y^2} - \dfrac{1}{\sigma^2} \right) \to {}_d 0, \end{align}

であり、これは 00 に確率収束する。また、デルタ法を用いて g(σ2)=1/σ2g(\sigma^2)=1/\sigma^2 に対して g(σ2)=1/σ4g'(\sigma^2) = -1/\sigma^4 だから

n(1VY21σ2)dN(0,2/σ4), \begin{align} \sqrt{n}\left( \dfrac{1}{V_Y^2} - \dfrac{1}{\sigma^2} \right) \to {}_d N(0, 2/\sigma^4), \end{align}

となる。したがって、

n(σ2VY21)=σ2n(1VY21σ2)dN(0,2). \begin{align} \sqrt{n}\left( \dfrac{\sigma^2}{V_Y^2}- 1 \right) &= \sigma^2\cdot\sqrt{n}\left( \dfrac{1}{V_Y^2}- \dfrac{1}{\sigma^2} \right) \to {}_d N(0, 2). \end{align}

同様に

n(VX2σ21)dN(0,2), \begin{align} \sqrt{n}\left(\dfrac{V_X^2}{\sigma^2} - 1\right) \to {}_d N(0,2), \end{align}

であるから、n(F1)dN(0,4)\sqrt{n}(F-1) \to {}_d N(0,4)

問 6

(a)(a) pp に対する尤度関数 L(p)L(p)

L(p)=i=1np(1p)xi \begin{align} L(p) &= \prod_{i=1}^{n}p(1-p)^{x_i} \end{align}

だから、フィッシャー情報量 I(p)I(p)

I(p)=E[d2dp2logL(p)]=i=1nE[d2dp2{logp+Xilog(1p)}]=i=1n{1p21(1p)2E[Xi]}. \begin{align} I(p) &= -E\left[ \dfrac{d^2}{dp^2} \log L(p) \right] \notag \\ &= - \sum_{i=1}^{n} E\left[ \dfrac{d^2}{dp^2}\left\{ \log p + X_i \log(1-p) \right\} \right] \notag \\ &= -\sum_{i=1}^{n} \left\{ -\dfrac{1}{p^2}-\dfrac{1}{(1-p)^2}E[X_i] \right\}. \end{align}

ここで、

E[Xi]=i=1xp(1p)x,11s=1+s+s2+=k=0sk,i=1(1p)x=1p,(kx,s1p) \begin{align} E[X_i] &= \sum_{i=1}^{\infty} x\cdot p(1-p)^x, \\ \dfrac{1}{1-s} &= 1+s+s^2+\cdots \\&= \sum_{k=0}^{\infty}s^k, \\ \therefore \sum_{i=1}^{\infty} (1-p)^x &= \dfrac{1}{p}, \hspace{3mm}(\because k \to x,\hspace{1mm}s \to 1-p)\\ \end{align}

両編を pp について微分して

i=1x(1p)x1=1p2,E[Xi]=1pp \begin{align} \sum_{i=1}^{\infty}x(1-p)^{x-1} &= \dfrac{1}{p^2}, \\ \therefore E[X_i] &= \dfrac{1-p}{p} \end{align}

以上より、

I(p)=i=1n{1p21p(1p)}=np2(1p) \begin{align} I(p) &= -\sum_{i=1}^{n} \left\{ -\dfrac{1}{p^2} - \dfrac{1}{p(1-p)} \right\} \notag \\ &= \dfrac{n}{p^2(1-p)} \end{align}

また、 pp に対する最尤推定量 p^\hat{p}logL(p)\log L(p) の微分が 00 になるときを考えれば良いので、

ddplogL(p)=i=1n(1pXi1p)=0,np^11p^i=1nXi=0,p^{i=1nXi+n}=n,p^=11+Xˉ.(1ni=1nXi) \begin{align} \dfrac{d}{dp}\log L(p) &= \sum_{i=1}^{n} \left( \dfrac{1}{p} - \dfrac{X_i}{1-p} \right) = 0, \\ \dfrac{n}{\hat{p}} - \dfrac{1}{1-\hat{p}}\sum_{i=1}^n X_i &= 0, \\ \hat{p}\left\{ \sum_{i=1}^{n}X_i + n \right\} &= n, \\ \therefore \hat{p} &= \dfrac{1}{1+\bar{X}}. \hspace{3mm}\left( \dfrac{1}{n}\sum_{i=1}^{n}X_i \right) \end{align}

n(p^p)\sqrt{n}(\hat{p}-p) の漸近分布は

E[Xˉ]=1pp=1p1, \begin{align} E[\bar{X}] &= \dfrac{1-p}{p} = \dfrac{1}{p} -1, \end{align}

より、pp の不偏推定量は E[11+Xˉ]=pE\left[\dfrac{1}{1+\bar{X}}\right] = p より、11+Xˉ\dfrac{1}{1+\bar{X}} 。また分散は、クラメール・ラオの不等式の下限が

V(p)1I(p), \begin{align} V(p) \geq \dfrac{1}{I(p)}, \end{align}

このように表されるので、V[11+Xˉ]=p2(1p)nV\left[\dfrac{1}{1+\bar{X}}\right] = \dfrac{p^2(1-p)}{n}。ゆえに n(p^p)dN(0,p2(1p))\sqrt{n}(\hat{p}-p) \to {}_d N(0, p^2(1-p)) に収束する。

(b)(b) θ\theta のフィっしゃ情報量 I(θ)I(\theta)θ=(1p)/p,\theta = (1-p)/p, p=1/(1+θ)p=1/(1+\theta) だから (a)(a) の尤度関数を変形して

L(θ)=i=1n(11+θ)(θ1+θ)xi,d2dθ2logL(θ)=d2dθ2{nlog(1+θ)+i=1nXilogθ1+θ}=n1(1+θ)2+{1θ21(1+θ)2}nθ=nθ(1+θ), \begin{align} L(\theta) &= \prod_{i=1}^{n}\left( \dfrac{1}{1+\theta} \right)\left(\dfrac{\theta}{1+\theta}\right)^{x_i}, \\ \dfrac{d^2}{d\theta^2}\log L(\theta) &= \dfrac{d^2}{d\theta^2} \left\{ -n\log (1+\theta) + \sum_{i=1}^{n}X_i\log\dfrac{\theta}{1+\theta} \right\} \notag \\ &= n\cdot\dfrac{1}{(1+\theta)^2} + \left\{ \dfrac{1}{\theta^2} - \dfrac{1}{(1+\theta)^2} \right\}\cdot n\theta \notag \\ &= \dfrac{n}{\theta (1+\theta)}, \end{align}

より、クラメール・ラオの下限はこの逆数の θ(1+θ)/n\theta(1+\theta)/n となる。

(c)(c) θ\theta の最尤推定量 θ^\hat{\theta}

ddθlogL(θ)=n1+θ+1θi=1nXi11+θi=1nXi, \begin{align} \dfrac{d}{d\theta} \log L(\theta) &= -\dfrac{n}{1+\theta} + \dfrac{1}{\theta}\sum_{i=1}^{n}X_i - \dfrac{1}{1+\theta}\sum_{i=1}^{n}X_i, \end{align}

00 とする θ\theta だから、

n1+θ^+nXˉ(1θ^11+θ^)=0,θ^=Xˉ. \begin{align} -\dfrac{n}{1+\hat{\theta}} + n\bar{X}\left(\dfrac{1}{\hat{\theta}}-\dfrac{1}{1+\hat{\theta}}\right) &= 0, \\ \therefore \hat{\theta} &= \bar{X}. \end{align}

一方、θ\theta の不偏推定量は E[Xˉ]=1p1=θE[\bar{X}] = \dfrac{1}{p} - 1 = \theta だから、θ^\hat{\theta}θ\theta の不偏推定量。ゆえに漸近分布 n(θ^θ)dN(0,θ(1+θ))\sqrt{n}(\hat{\theta}-\theta) \to {}_d N(0, \theta(1+\theta)).

(d)(d) デルタ法より n(g(Xˉ)g(θ))dN(0,(g(θ))2θ(1+θ))\sqrt{n}(g(\bar{X})-g(\theta)) \to {}_d N(0, (g'(\theta))^2\cdot \theta(1+\theta)) なので、漸近分散が 11 となるには、

g(θ)=1θ(1+θ),=1/θ+1/1+θθ+1+θ,g(θ)=1θ(1+θ)dθ=2log(θ+1+θ). \begin{align} g'(\theta) &= \dfrac{1}{\sqrt{\theta(1+\theta)}}, \notag \\ &= \dfrac{1/\sqrt{\theta}+1/\sqrt{1+\theta}}{\sqrt{\theta}+\sqrt{1+\theta}}, \\ \therefore g(\theta) &= \int \dfrac{1}{\sqrt{\theta(1+\theta)}} d\theta \notag \\ &= 2\log(\sqrt{\theta}+\sqrt{1+\theta}). \end{align}

問 7

(a)(a) E[Xi]=npi,Var(Xi)=npi(1pi),Cov(Xi,Xj)=npipjE[X_i] = np_i,\hspace{1mm}{\rm Var}(X_i) = np_i (1-p_i), \hspace{1mm}{\rm{Cov}}(X_i, X_j) = -np_ip_j であることを利用する。

E[Yi]=E[X1+X3]=E[X1]+E[X3]=nθ,Var(Y1)=Var(X1)+Var(X3)+2Cov(X1,X3)=np1(1p1)+np3(1p3)2np1p3=n(p1+p3)n(p1+p3)2=nθ(1θ). \begin{align} E[Y_i] &= E[X_1+X_3] \notag \\ &= E[X_1] + E[X_3] \notag \\ &= n\theta, \\ {\rm{Var}}(Y_1) &= {\rm{Var}}(X_1) + {\rm{Var}}(X_3) + 2{\rm{Cov}}(X_1, X_3) \notag \\ &= np_1(1-p_1) + np_3(1-p_3) - 2np_1p_3 \notag \\ &= n(p_1+p_3) - n(p_1+p_3)^2 \notag \\ &= n\theta(1-\theta). \end{align}

(b)(b) 共分散の公式を利用して

Cov(Y1,Y2)=Cov(X1+X3,X2+X3)=Cov(X1,X2)+Cov(X1,X3)+Cov(X2,X3)+Var(X3)=np1p2np1p3np2p3+np3(1p3)=n(1θ)(1θ)n(1θ)(12θ)n(1θ)(12θ)+2nθ(12θ)=n(1θ)2. \begin{align} {\rm{Cov}}(Y_1, Y_2) &= {\rm{Cov}}(X_1+X_3, X_2+X_3) \notag \\ &= {\rm{Cov}}(X_1, X_2) + {\rm{Cov}}(X_1, X_3) + {\rm{Cov}}(X_2, X_3) + {\rm{Var}}(X_3) \notag \\ &= -np_1p_2 -np_1p_3 -np_2p_3 +np_3(1-p_3)\notag\\ &= -n(1-\theta)(1-\theta) - n(1-\theta)(1-2\theta) - n(1-\theta)(1-2\theta) + 2n\theta(1-2\theta)\notag \\ &= -n(1-\theta)^2. \end{align}

(c)(c) θ^U=(Y1+Y2)\hat{\theta}^U = (Y_1+Y_2) の平均は、

E[θ^U]=(nθ+nθ)/2n=θ. \begin{align} E[\hat{\theta}^U] &= (n\theta + n \theta)/2n \notag \\ &= \theta. \end{align}

なので、θ^U\hat{\theta}^Uθ\theta の不偏推定量。

分散は、

Var(θ^U)=14n2{Var(Y1)+Var(Y2)+2Cov(Y1,Y2)}=14n2n{2θ(1θ)2(1θ)2}=(1θ)(2θ1)2n, \begin{align} {\rm{Var}}(\hat{\theta}^U) &= \dfrac{1}{4n^2}\cdot\{ {\rm{Var}}(Y_1) + {\rm{Var}}(Y_2) + 2 {\rm{Cov}}(Y_1,Y_2) \}\notag \\ &= \dfrac{1}{4n^2}\cdot n\cdot \{ 2\theta(1-\theta) - 2(1-\theta)^2 \} \notag \\ &= \dfrac{(1-\theta)(2\theta - 1)}{2n}, \end{align}

となる。ゆえに大小関係は 2θ12=θ12<θ\dfrac{2\theta - 1}{2} = \theta - \dfrac{1}{2} < \theta より

Var(Y1/n)=θ(1θ)n>(1θ)(2θ1)2n=Var(θ^U), \begin{align} {\rm{Var}}(Y_1/n) &= \dfrac{\theta(1-\theta)}{n} > \dfrac{(1-\theta)(2\theta - 1)}{2n} = {\rm{Var}}(\hat{\theta}^U), \end{align}

なる関係が成立する。

2. 参考

  • 著者によるサポートサイト

https://sites.google.com/site/ktatsuya77/xian-dai

  • 本記事の元となる参考書

https://www.amazon.co.jp/現代数理統計学の基礎-共立講座-数学の魅力-久保川-達也/dp/4320111664/ref=sr_1_1?adgrpid=54805103953&dib=eyJ2IjoiMSJ9.VfpslZPA1hJcfZ6GlybM-BZElkBWvqf_Kgatswm5-uX-Rrr_zfpqFGXO-NlbMC9zUyFJWtoYVeHn0o3hzvE5fUzz34WzR2P5xlIUbq0M3-04VS8sdgU9Im81G6IDCTe92fqP2zERyXknA-SxuJo6c4rID80O3TITMkCj8zIqUUtsjOAvwy2MEhwNtfo6XTrARa_uQcxbniCxvdty1ozAc1drBy7jb9CMkeEJLzVdivESA6t7XFhBQd8abcBqrl1ioB1rykxF7eVJQhTDVYlUZd9GAsxV3Na-3QayAl4fXw4.dB_yUwhlbUtbO47o1oxG1p9Ni0qdcFS5Sxi-dufB18E&dib_tag=se&hvadid=679073105221&hvdev=c&hvlocphy=1009298&hvnetw=g&hvqmt=e&hvrand=6287229992004864408&hvtargid=kwd-332372924816&hydadcr=27703_14738805&jp-ad-ap=0&keywords=現代数理統計学の基礎&qid=1732920700&sr=8-1

  • 他の方が書かれた参考書の章末問題 + テスト (基礎編) の解説記事(参考書を読む上で非常に理解の助けになった)

https://qiita.com/toukei/items/f9c19bf506b9894ba04e

Discussion

ログインするとコメントできます