📊

【統計検定準1級】統計的仮説検定

に公開

※最近すでに投稿している記事の加筆修正に時間を使っていて、新しい記事がなかなか進んでいません。この記事もまだまだ肉付けができていないのですが…一応上げます。

はじめに

この記事では、統計検定準1級取得に向けて学習したことをまとめていきます。
工学系の数学ではなく数理あるあるの、論述ゴリゴリな解答になっていると思いますのであらかじめご了承ください。
注意:さらに計算過程は数学文化の『省略の美』を無視してエレファントに書いています。

【リンク紹介】
統計検定準1級のまとめ記事一覧
これまで書いたシリーズ記事一覧

学習書籍について

この記事では「統計学実践ワークブック」を中心に、学んだことをまとめていきます。記事を読んで本格的に勉強してみたいなと思った方は、是非ご購入を検討なさってください。


参考書籍について

統計実践ワークブックは、大量の知識項目と問題が収められている反面、計算過程や知識背景が大きく省略されているため、知識体系をきちんと学ぶ参考書として東京大学から出版されている名著「統計学入門」を使っています。


また、今回定義のまとめにあたり様々な書籍を参考にしました。詳しくは参考資料をご確認ください。

0.前提知識の定義

\Theta母数空間
\mathscr{X}標本空間
x変数
X標本
t統計量

0.1.統計的仮説検定

母集団においてどちらかが真実である2つの仮説を考え、どちらかが正しいかをデータから判断する方法を、統計的検定(statistical test of hypotheses)という。

1.帰無仮説・対立仮説

母数空間\Thetaが互いに排反な2つの部分集合\Theta_0, \Theta_1に分けられているとする。つまり、以下が成り立つ。

\Theta = \Theta_0 \cup \Theta_1, \hspace{5mm} \Theta_0 \cap \Theta_1 = \varnothing

1.1.帰無仮説

このとき、未知パラメータ\theta\Theta_0に属しているとする仮説を帰無仮説(null hypothesis)といい、

H_0 \ : \ \theta \in \Theta_0

と表す。

1.1.1.単純仮説

\Theta_0の要素が1つしかないとき、H_0単純仮説(simple hypothesis)という。より狭義的に単純帰無仮説ということもある。

1.1.2.複合仮説

\Theta_0の要素が2つ以上とき、H_0複合仮説(composite hypothesis)という。より狭義的に複合帰無仮説ということもある。

1.2.対立仮説

これに対し、未知パラメータ\theta\Theta_1に属しているとする仮説を対立仮説(alternative hypothesis)といい、

H_1 \ : \ \theta \in \Theta_1

と表す。

1.1.1.単純仮説

\Theta_1の要素が1つしかないとき、H_1単純仮説(simple hypothesis)という。より狭義的に単純対立仮説ということもある。

1.1.2.複合仮説

\Theta_1の要素が2つ以上とき、H_1複合仮説(composite hypothesis)という。より狭義的に複合対立仮説ということもある。

2.仮説の正しさ

2.1.棄却する

標本の実現値を元にした統計量の値が集合Rに属するとき、帰無仮説 H_0 を棄却する(reject)といい、対立仮説H_1が正しいと判断されたとみなす。
※「H_0が採択される」、「H_0を受容する」ともいう。

2.1.1.棄却域

帰無仮説H_0を棄却すべき統計量の値の集合を棄却域(rejection region)といい、Rで表す。

2.1.2.検定統計量

検定に用いる統計量を、特に検定統計量(test statistic)という。

2.2.採択する

標本の実現値を元にした統計量の値が集合Rに属さないとき(R^cに属するとき)、帰無仮説 H_0 を採択する(accept)といい、帰無仮説H_0が正しいと判断されたとみなす。
※「H_0は棄却される」ともいう。

2.2.1.採択域

棄却域Rに対して、R^cRの補集合)を採択域(acceptance region)という。採択域をR^cではなくAで表すこともある。

2.3.仮説の誤り

2.3.1.第一種の誤り

帰無仮説H_0が正しいにもかかわらず、帰無仮説H_0を棄却して対立仮説H_1を正しいと判断することを第一種の誤り(error of the first kind)という。

2.3.2.第二種の誤り

対立仮説H_1が正しいにもかかわらず、対立仮説H_1を棄却して帰無仮説H_0を正しいと判断することを第二種の誤り(error of the second kind)という。

どちらの誤りが起こる確率も小さい方が良いが、第一種の誤りをおかす確率と第二種の誤りをおかす確率はトレードオフの関係である。そこで、一般的には第一種の誤りをおかす確率を一定値\alpha以下に抑えるように工夫することとする。

2.4.有意水準

※未執筆

3.片側仮説検定・両側仮説検定

3.1.片側仮説検定

帰無仮説H_0に対して、対立仮説H_1が以下のように片側にだけ存在するような仮説検定を、片側仮説検定(on-sided test)という。

H_0 \ : \ \theta \leqq \Theta_0 \\ H_1 \ : \ \theta > \Theta_1 \\ または、帰無仮説の境界に着目して \\ H_0 \ : \ \theta = \Theta_0 \\ H_1 \ : \ \theta > \Theta_1

3.2.両側仮説検定

帰無仮説H_0に対して、対立仮説H_1が以下のように両側に存在する仮説検定を、両側仮説検定(two-sided test)という。

H_0 \ : \ \theta = \Theta_0 \\ H_1 \ : \ \theta \neq \Theta_1

参考資料

\bf{\textcolor{red}{記事が役に立った方は「いいね」を押していただけると、すごく喜びます \ 笑}}
ご協力のほどよろしくお願いします。

Discussion