はじめに
母平均の検定、個人的に仮説検定めっちゃ苦手です。というのも、なんか整理しきれてないんですよね。大学院で統計を専門でやっているのに恥ずかしい話ですが、私ですら苦手なので多くの人が苦手意識を持っているのではないでしょうか。なので今回は、苦手な人にも分かりやすいように解説していくので見ていってください。
ちなみに仮説検定は, 帰無仮説 H と対立仮説 K として
片側検定
(1)(2) H:θ=θ0, K:θ>θ0; H:θ≤θ0, K:θ>θ0;(1′)(2′) H:θ=θ0, K:θ<θ0; H:θ≥θ0, K:θ<θ0;
と両側検定
(3) H:θ=θ0, K:θ=θ0
があります。
(2),(2’)は(1),(1’)と同様の棄却域を考えれば良いです。(3)は(1)と(1’)を合わせた棄却域を考えれば良いです。
ロードマップ
最速で理解したい人はこの図を暗記してください。笑

平均μ ,分散σ2をもつなんらかの分布からデータが得られるとする。
まず、母平均の検定には2つの場合がある。
正規分布かどうか、分散が既知かどうか
ここが大きな違いです。
これらの場合について詳しく見ていきます。
母平均の仮説検定
(1)のパターンを見ていく。
H:μ=μ0, K:μ>μ0
の水準αの問題を考える。平均μ,分散σ2の分布からのn個のデータをX1,…,Xnとする。
まず、Hのもとで考える。つまり母平均μ がμ0であると仮定する。
標本平均Xˉ=n−1∑i=1nXi は不偏性を持つのでE(Xˉ)=μであることに注意。
このときXˉの期待値と分散は, E(Xˉ)=μ0 ,
分散が既知の場合は Var(Xˉ)=σ2/n
分散が未知の場合は不偏推定量S02=∑i=1n(Xi−Xˉ)2/(n−1)をσ2の代わりに用いてVar(Xˉ)=S02/n。
統計量Uを次のように定義する。
U=Var(Xˉ)Xˉ−E(Xˉ)
Uが何の分布に従うかを考える。
正規分布のとき
1. 分散 σ2 が既知の場合
U=σn(Xˉ−μ0)
U はデータが正規分布から取られているためそのまま標準正規分布に従う。
対立仮説 K:μ>μ0であるため有意水準α とすると棄却域を(a,∞)としたとき
α=P{Xˉ>a}=P{U>n(a−μ0)/σ}
を考えれば良い。α はユーザーが決める。例えば、0.05や0.01がよく用いられる。これよりa がもとまる。
(2)式の式変形はどうなってるかというと
P{Xˉ>a}=P{(Xˉ−μ0)/σ>(a−μ0)/σ}=P{n(Xˉ−μ0)/σ>n(a−μ0)/σ}
N(0,1)の上側100α%点 : uα,
P{Z>uα}=α(2)
uα=n(a−μ0)/σ
を計算すれば良いことがわかる。結果は、
a=μ0+uα(σ/n)
したがって
xˉ>μ0+uα(σ/n)⇒Hを棄却xˉ≤μ0+uα(σ/n)⇒Hを受容
検出力を求める。対立仮説K:μ>μ0のもとで棄却域に入る確率を考えれば良い。
γ(μ)=P(Xˉ>μ0+uαnσ)=P(Xˉ−μ>μ0−μ+uαnσ)=P(σn(Xˉ−μ)>σn(μ0−μ)+uα)=Φ(−σn(μ0−μ)−uα)
ただしΦはN(0,1)のc.d.f.とする。
2. 分散 σ2 が未知の場合
分散が未知だから不偏推定量S02でσ2を置き換える。
これらを用いて統計量Uは次のようになる。
U=S0n(Xˉ−μ0)
Uは自由度n−1のτ分布に従う。標準正規分布ではなくt分布になることに注意。←ここは暗記して!
対立仮説 K:μ>μ0であるため有意水準α とすると棄却域を(a,∞)としたとき
α=P{T>a}
tn−1分布の上側100α%点 : tα(n−1)
データから(4)の値t∗を計算して
t∗>tα(n−1)⇒Hを棄却t∗≤tα(n−1)⇒Hを受容
次に検出力を求める。対立仮説K:μ>μ0のもとで棄却域に入る確率を考えれば良い。
γ(μ)=P(U>tα(n−1))=P(S0n(Xˉ−μ0)>tα(n−1))=P(S0n(Xˉ−μ)>tα(n−1)+S0n(μ0−μ))=Gn−1(−tα(n−1)−S0n(μ0−μ))
ただし、tn−1分布のc.d.f.をGn−1とする。
正規分布以外のとき
データの取られ方が正規分布以外の時のUは(1)または(4)と同様に定義できる。なぜなら中心極限定理よりnが大きい時、漸近的にUは標準正規分布に従う。
分散が未知でも正規分布以外の時はt分布ではなく標準正規分布で近似することに注意。
Uを用いて正規分布の分散既知の場合と同様に棄却域を求めれば良い。
まとめ
何だかややこしいですが、分布が正規分布で分散未知だったらt分布。それ以外は標準正規分布と覚えておきましょう。
t分布も漸近的には正規分布で近似できるので、大雑把にやってしまえば全て標準正規分布で近似して棄却域を求めてるみたいなもんですね。実際大雑把にやるのはダメなのでt分布を用いるのですが、、、
参考文献
Discussion