もう迷わない!等分散性検定の使い分け完全ガイド【実務向け】
はじめに
本記事の目的
統計検定には「似ているようで微妙に使いどころが異なる」手法が多くあります。
本記事では「何を見てどの手法を使うか」に焦点を当てて整理していきます。
例:F検定 vs Bartlett検定 など
対象読者
「マーケティングや業務改善など、実務で統計を使う人」、
「統計検定の資格や基礎知識は持っているが、実務でどう使うかわからない人」、
「難しい話はいいから、何を使えばいいか教えてほしい人」
本記事のまとめ(結論だけ知りたい方へ)
等分散性検定の使い分け:
正規性がある → F検定 / Bartlett検定
正規性が怪しい → Levene検定 / Brown-Forsythe検定 / Fligner-Killeen検定
外れ値ありそう → Brown-Forsythe検定 / Fligner-Killeen検定
等分散性検定とは何か
等分散性検定は「複数のグループでデータのばらつき(分散)が等しいかどうか」を
統計的に判断する方法
等分散性がある状態とは?
グループごとのデータの広がり具合が同じ
例:AグループもBグループも、データが平均から±10の範囲に分布
なぜ等分散性が重要?
等分散性がない場合、統計的仮説検定の信頼性が下がる(p値や信頼区間が正確でなくなる)。
分散が異なるとt値が過大または過少になり、p値が信頼できなくなる
→ 本当は差がないのに「有意」と判定される(第1種の誤り)、本当は差があるのに「有意でない」と見なされる(第2種の誤り)が発生する恐れがある
等分散性が前提となる統計手法 ※随時更新予定
手法 | 等分散性が前提か? | 等分散性が必要/不要の理由 |
---|---|---|
Studentのt検定 | 必要 | 分母に共通分散を使用するため、分散が等しいことが前提 |
Welchのt検定 | 不要 | 分散が異なることを考慮した検定で、分散を別々に扱うため |
Mann-Whitney検定 | 不要 | ノンパラメトリック手法[1]で順位に基づくため、等分散性や正規性は前提としない |
ANOVA(分散分析) | 必要 | 分散の均一性(等分散性)が前提、分散が等しくないと第1種の過誤が増える |
WelchのANOVA | 不要 | 分散が異なる群を比較するための分散分析手法で、等分散性は前提としない |
回帰分析(OLS) | 必要 | 誤差項の分散が一定(等分散性)であることが前提、これが満たされないと推定量の分散が誤る |
等分散性を満たさないときはどうすればいいか?
-
等分散性が不要な手法やノンパラメトリック検定に切り替える:
Welchのt検定、WelchのANOVA、 Mann-WhitneyのU検定、Kruskal-Wallis検定等 - 変数の変換(分散を均質にする)::対数変換[2]、平方根変換[3]、Box-Cox変換[4]など
- ロバスト推定法・ブートストラップ[5]手法を使う:Huber推定など
代表的な検定手法とその使い分け
手法 | 特徴 | 比較する群数 | 正規性 | 外れ値耐性 | 推奨シーン |
---|---|---|---|---|---|
F検定 | 2群の分散比を検定 | 2群 | 必要 | 弱い | 2群のt検定前(正規性あり) |
Bartlett検定 | 精度が高いが正規性に非常に敏感 | 2群以上(2群の場合はF検定で十分のため3群以上で使われる) | 必要 | 弱い | 正規性が保証される実験データ向き |
Levene検定 | 中央値や平均からの偏差ベース | 2群以上 | 不要 | 中程度 | 実務全般、ANOVAの前処理としてよく使われる |
Brown-Forsythe検定 | Levene検定の中央値ベース版 | 2群以上 | 不要 | 強い | 外れ値があるデータでの頑健な検定 |
Fligner-Killeen検定 | 順位に基づく検定で最もロバスト | 2群以上 | 不要 | 非常に強い | 分布不明、外れ値が多い場合 |
注意点・落とし穴
-
正規性が前提の手法に注意:
F検定・Bartlett検定等の正規性が前提の手法を使うと、有意性が誤って出やすくなる -
外れ値の影響を考慮すべし:
外れ値に弱い手法もあるため、箱ひげ図やIQRなどで外れ値有無をチェックしたうえで
手法を検討すべき -
帰無仮説(=等分散である)のとらえ方に注意:
帰無仮説が棄却できない場合「等分散性がないとは言えない」、棄却の場合は「等分散性があるとは言えないが、ないとも言えない」と積極的に証明されたわけではないため、解釈を断定しない
(こういった事情もありWelchのt検定が最初から使用されやすい) - 小サンプルの場合検出力が低くなる:差があっても見逃す可能性あり(目安: n > 30)
-
複数群で等分散性がわかっても2群間の等分散性は保証されない:
全体として等分散かを検定するため、3群あった際にAvsBだけが等分散とは限らない
まとめ:等分散性検定の選び方
-
3つの観点で使い分ける!
① 群の数
→ 2群:F、Levene、Brown-Forsythe、Fligner /
3群以上:Bartlett、Levene、Brown-Forsythe、Fligner② 正規性の有無
→ ある:F検定、Bartlett検定 / ない:Levene、Brown-Forsythe、Fligner③ 外れ値への耐性
→ 弱い:F、Bartlett / 中:Levene / 強:Fligner、Brown-Forsythe
関連記事
Discussion