はじめに
今回は統計検定1級より 2014年 統計数理 問題4 の解答を記載します。
問題は計画行列の評価において、推定量の分散だけでなく非心度も考慮したものであり、
統計検定1級の中でもかなりハイレベルな問題(個人的には最難関)です。
公式の解答等では飛躍があり、理解するのが非常に難しい問題ですが、一助となれば幸いです。
問題については著作物のため割愛します。
[1]
[計画行列 X]
計画行列の i 行は i 回目にどの物体を測るか。第 j 列は j 番目の物体は何回目に測定するかを示す。従って(1), (2)における計画行列 X は
(1)
X(1)=1 1 0 0 0 0 0 0 0 00011000000000011000000000011000000000011(2)
X(2)=1 1 1 1 0 0 0 0 0 01000111000010010011000100101010001001011
[正規方程式]
(x−Xθ) を最小にするような θ を計算する。
∣∣x−Xθ∣∣2=(x−Xθ)′(x−Xθ)=(x′−θ′X′)(x−Xθ)=x′x−x′Xθ−θ′X′x+θ′X′Xθ=x′x−2θ′X′x+θ′X′Xθ
dθd∣∣x−Xθ∣∣2=2X′Xθ−2X′x=0 とすると、
X′Xθ=X′x
よって正規方程式は真値 θ の推定量を θ^ として、
X′Xθ^=X′x
θ^=(X′X)−1X′x
となる。′は転置を表す。
[2]
[1]より
θ^=(X′X)−1X′x=(X′X)−1X′(Xθ+ε)=θ+(X′X)−1X′ε
よって、
V[θ^]=V[(X′X)−1X′ε]=(X′X)−1X′E[εε′]((X′X)−1X′)′=(X′X)−1X′σ2IX(X′X)−1=(X′X)−1σ2(1)
X(1)′X(1)=1000010000010000100000100001000001000010000010000111000000000011000000000011000000000011000000000011=2000002000002000002000002=21000001000001000001000001
V[θ^]=σ2(X(1)′X(1))−1=2σ21000001000001000001000001
V[θi^]=2σ2(i=1,...,5)(2)
X(2)′X(2)=1100010100100101000101100010100100100110001010001111110000001000111000010010011000100101010001001011=4111114111114111114111114
V[θ^]=σ2(X(2)′X(2))−1=24σ27−1−1−1−1−17−1−1−1−1−17−1−1−1−1−17−1−1−1−1−17
V[θi^]=247σ2(i=1,...,5)
[3]
帰無仮説 H0 (θ1=,…,=θ5(=θ0 とする )) が真の場合においては、自由度が 5→1 と変化することにより計画行列 X が異なることに注意する。
H0 における計画行列 X を X0、θを θ0 とすると、
(1)の場合、第 i 回目の測定において、 (i=1,…,10)
xi=θ0+εi
となることから、
x=θ0i10+εX0(1)=i10,θ0=θ0
(in はすべての成分が 1 の n 次ベクトル)
と表せる。同様に(2)では第 i 回目の測定においては (i=1,…,10)
xi=2θ0+εi
となることから、
x=2θ0i10+εX0(2)=2i10,θ0=θ0
θ^0については
θ^0(1)θ^0(2)=(i10′i10)−1i10′x=10−1(x1+⋯+x10)=xˉ=(2i10′2i10)−12i10′x=40−1⋅2(x1+⋯+x10)=2xˉ
よって、X0θ^0 については(1), (2)で等しく、
X0θ^0=xˉi10
となる。
また、X0 については(1), (2) の両者の場合において、以下のように表現することができる。
X0=XB(B=i5)
求める検定統計量は、F 統計量であることから、カイ二乗分布に従い、かつ互いに独立な 2 つの確率変数が必要である。
観測値と推定値の差を二乗して合計した残差平方和はカイ二乗分布に従うことから、残差平方和を使用する。
単純に帰無仮説 H0 における残差平方和 S0 と対立仮説 H1 における残差平方和 S1 を使用することはできない。両者は独立ではないためである。
そこで、S1,S0−S1 を使用する。ここで、S0,S1は以下のように表せる。
S0=∣∣x−X0θ^0∣∣2,S1=∣∣x−Xθ^∣∣2
まず、S1,S0−S1 をそれぞれ求め、S1 と S0−S1 が独立であることを証明する。
S0 を分解すると、
S0=∣∣(x−Xθ^)+(Xθ^−X0θ^0)∣∣2=∣∣x−Xθ^∣∣2+2(x−Xθ^)′(Xθ^−X0θ^0)+∣∣Xθ^−X0θ^0∣∣2=S1+∣∣Xθ^−X0θ^0∣∣2+2(x−Xθ^)′(Xθ^−X0θ^0)
となる。
ここで、θ^=(X′X)−1X′x, θ^0=(X0′X0)−1X0′x から、以下のように A2,A3 を定義する。
x−Xθ^Xθ^−X0θ^0=x−X(X′X)−1X′x=(I10−X(X′X)−1X′)x=A3x=(X(X′X)−1X′−X0(X0′X0)−1X0′)x=A2x
よって、
(x−Xθ^)′(Xθ^−X0θ^0)=x′A3′A2x=x′(I10−X(X′X)−1X′)′(X(X′X)−1X′−X0(X0′X0)−1X0′)x=x′(I10−X(X′X)−1X′)(X(X′X)−1X′−X0(X0′X0)−1X0′)x=x′(X(X′X)−1X′−X0(X0′X0)−1X0′−X(X′X)−1X′+X(X′X)−1X′X0(X0′X0)−1X0′)x=x′(X(X′X)−1X′−I10)X0(X0′X0)−1X0′x=x′(X(X′X)−1X′−I10)XB(X0′X0)−1X0′x=x′(X−X)B(X0′X0)−1X0′x=x′Ox=0
ゆえに、
S0=S1+∣∣Xθ^−X0θ^0∣∣2S0−S1=∣∣Xθ^−X0θ^0∣∣2
また、
Cov[(x−Xθ^),(Xθ^−X0θ^0)]=E[(A3x)(A2x)′]=A3E[xx′]A2′=A3V[x]A2=A3V[ε]A2=A3σ2I10A2=σ2A3A2=O
となる。よって、(x−Xθ^) と
(Xθ^−X0θ^0) は独立であることから、
S1=∣∣x−Xθ^∣∣2,S0−S1=∣∣Xθ^−X0θ^0∣∣2
も同様に独立である。
次に、帰無仮説 H0 が真である場合の S1,S0−S1 が従う分布について考える。
H0 においては x=X0θ0+ε であるから、
S1=∣∣x−Xθ^∣∣2 については
x−Xθ^=A3x=A3X0θ0+A3ε=(I10−X(X′X)−1X′)XBθ0+A3ε=(X−X)Bθ0+A3ε=A3ε
σ2S1=σ21∣∣x−Xθ^∣∣2=σ21ε′A3′A3ε=(σε)′A3(σε)
S0−S1=∣∣Xθ^−X0θ^0∣∣2 については
Xθ^−X0θ^0=A2x=A2X0θ0+A2ε=(X(X′X)−1X′−X0(X0′X0)−1X0′)X0θ0+A2ε=(X(X′X)−1X′X0−X0)θ0+A2ε=(X(X′X)−1X′X−X)Bθ0+A2ε=A2ε
σ2S0−S1=σ21∣∣Xθ^−X0θ^0∣∣2=σ21ε′A2′A2ε=(σε)′A2(σε)
ここで、上記の A2(=X(X′X)−1X′−X0(X0′X0)−1X0′),A3(=I10−X(X′X)−1X′) に加え、A1=X0(X0′X0)−1X0′とすると、以下の式を満たす。この式から A1,A2,A3 がどのような行列であるかを考える。
⎩⎨⎧A1+A2+A3=I10(i)A1A2=O(ii)A3A2=O(iii)A12=A1(iv)A32=A3(v)
(ii)
A1A2=X0(X0′X0)−1X0′(X(X′X)−1X′−X0(X0′X0)−1X0′)=X0(X0′X0)−1X0′X(X′X)−1X′−X0(X0′X0)−1X0′=X0(X0′X0)−1X0′(X(X′X)−1X′−I10)=X0(X0′X0)−1B′X′(X(X′X)−1X′−I10)=X0(X0′X0)−1B′(X′−X′)=O
(iii)
A3A2=(I10−X(X′X)−1X′)(X(X′X)−1X′−X0(X0′X0)−1X0′)=X(X′X)−1X′−X0(X0′X0)−1X0′−X(X′X)−1X′+X(X′X)−1X′X0(X0′X0)−1X0′=(X(X′X)−1X′−I10)X0(X0′X0)−1X0′=(X(X′X)−1X′−I10)XB(X0′X0)−1X0′=(X−X)B(X0′X0)−1X0′=O
(iv)
A12=X0(X0′X0)−1X0′X0(X0′X0)−1X0′=X0(X0′X0)−1X0′=A1
(v)
A32=(I10−X(X′X)−1X′)(I10−X(X′X)−1X′)=I10+X(X′X)−1X′−2X(X′X)−1X′=I10−X(X′X)−1X′=A3
(i) に A2 をかけることにより、
A1A2+A22+A3A2=A2
(ii),(iii) より
A22=A2
また、Ai′=Ai(i=1,2,3)を満たすことから、 A1,A2,A3 はすべて対称冪等行列である。
対称冪等行列は rank=trace となることから(後述)、(i)より
tr(A1+A2+A3)=tr(I10)tr(A1)+tr(A2)+tr(A3)=10rank(A1)+rank(A2)+rank(A3)=10
A1,A2,A3 の rank を求めると、
rank(A1)rank(A3)rank(A2)=tr({X0}{(X0′X0)−1X0′})=tr((X0′X0)−1X0′X0)=tr(1)=1=tr(I10)−tr({X}{(X′X)−1X′})=10−tr((X′X)−1X′X)=10−tr(I5)=5=10−rank(A1)−rank(A3)=4
まとめると、
⎩⎨⎧A1:rank 1 の対称冪等行列A2:rank 4 の対称冪等行列A3:rank 5 の対称冪等行列
rank=r の対称冪等行列 Ai について考える。
対称行列の性質により、Ai=C′ΛC(C:直交行列)と固有値分解できる。
また、冪等行列の性質により、固有値が 0,1 のみで構成される。ゆえにAi の rank は r であることから、Λ=diag(1,…,1,0,…,0)と表せる。( 1 が r 個、 0 が 10−r 個)
さらに、ε∼N(0,σ2I10) より, 以下のように u,z を定義すると、
⎩⎨⎧u=σε∼N(0,I10)z=Cu∼N(0,I10)(∵C:直交行列)
(σε)′Ai(σε)=u′Aiu=u′C′ΛCu=(Cu)′ΛCu=z′Λz=i=1∑rzi2∼χ2(r)
また、前述のように、 Ai の rank と trace には以下のような関係式がある。
rank(Ai)=rank(Λ)=tr(Λ)=tr({C}{AiC′})=tr(AiC′C)=tr(Ai)
よって、
⎩⎨⎧σ2S1σ2S0−S1∼χ2(5)∼χ2(4)
以上より、
F=σ2S1/5σ2S0−S1/4=∣∣x−Xθ^∣∣2/5∣∣Xθ^−X0θ0^∣∣2/4∼F(4,5)
[4]
題意より、F の分子の (Xθ^−X0θ0^) の期待値 E[Xθ^−X0θ0^]が問題文における期待値のベクトル(μ1,…,μ10)′(=μとする) に該当する。
ゆえに、非心度 λ=μ′μ と表せる。
対立仮説の下では x=Xθ+ε となることから、
Xθ^−X0θ^0=A2x=A2(Xθ+ε)=A2Xθ+A2ε
よって、
μ=E[Xθ^−X0θ0^]=A2Xθ=(X(X′X)−1X′X−X0(X0′X0)−1X0′X)θ=(X−X0(X0′X0)−1X0′X)θ
λ=((X−X0(X0′X0)−1X0′X)θ)′(X−X0(X0′X0)−1X0′X)θ=θ′(X′X−2X′X0(X0′X0)−1X0′X+X′X0(X0′X0)−1X0′X0(X0′X0)−1X0′X)θ=θ′(X′X−X′X0(X0′X0)−1X0′X)θ
ここで、X0(1)=i10,X0(2)=2i10 より X0=ki10 とおくと、
λ=θ′(X′X−X′ki10(ki10′ki10)−1ki10′X)θ=θ′(X′X−k2(10k2)−1X′i10i10′X)θ=θ′(X′X−101X′i10i10′X)θ=θ′(X′X−101X′i10(X′i10)′)θ
また、(1), (2) における X′X,X′i10 は
⎩⎨⎧X(1)′X(1)X(2)′X(2)=2 0 0 0 002000002000002000002=2I5=4 1 1 1 114111114111114111114=31 0 0 0 001000001000001000001+1 1 1 1 111111111111111111111=3I5+i5i5′
{X(1)′i10X(2)′i10=2i5=4i5
λ(1)=θ′2I5θ−101θ′2i52i5′θ=2i=1∑5θi2−52(i=1∑5θi)2=2(i=1∑5θi2−51(i=1∑5θi)2)=2i=1∑5(θi−θˉ)2(θˉ=51i=1∑5θi)
λ(2)=θ′(3I5+i5i5′)θ−101θ′4i54i5′θ=3i=1∑5θi2+(i=1∑5θi)2−58(i=1∑5θi)2=3(i=1∑5θi2−51(i=1∑5θi)2)=3i=1∑5(θi−θˉ)2
[5]
推定量の分散においては、(2)の方が(1)より小さいため、(2)の方法が適している。
非心度においては (2) の方が (1) よりも大きいため、 (2)の方法が適している。
ゆえに、(2) の方法が (1) よりも優れているといえる。
(非心度が大きいほうが、対立仮説が真の場合に検定統計量 F の分子が大きくなり、有意になりやすくなる。)
Discussion