🧭

もう迷わない!等分散性検定の使い分け完全ガイド【実務向け】

に公開

はじめに

本記事の目的

統計検定には「似ているようで微妙に使いどころが異なる」手法が多くあります。
本記事では「何を見てどの手法を使うか」に焦点を当てて整理していきます。
例:F検定 vs Bartlett検定 など

対象読者

「マーケティングや業務改善など、実務で統計を使う人」、
「統計検定の資格や基礎知識は持っているが、実務でどう使うかわからない人」、
「難しい話はいいから、何を使えばいいか教えてほしい人」

本記事のまとめ(結論だけ知りたい方へ)

等分散性検定の使い分け:
 正規性がある → F検定 / Bartlett検定
 正規性が怪しい → Levene検定 / Brown-Forsythe検定 / Fligner-Killeen検定
 外れ値ありそう → Brown-Forsythe検定 / Fligner-Killeen検定

等分散性検定とは何か

等分散性検定は「複数のグループでデータのばらつき(分散)が等しいかどうか」を
統計的に判断する方法

等分散性がある状態とは?

グループごとのデータの広がり具合が同じ
例:AグループもBグループも、データが平均から±10の範囲に分布

なぜ等分散性が重要?

等分散性がない場合、統計的仮説検定の信頼性が下がる(p値や信頼区間が正確でなくなる)。

分散が異なるとt値が過大または過少になり、p値が信頼できなくなる
→ 本当は差がないのに「有意」と判定される(第1種の誤り)、本当は差があるのに「有意でない」と見なされる(第2種の誤り)が発生する恐れがある

等分散性が前提となる統計手法 ※随時更新予定

手法 等分散性が前提か? 等分散性が必要/不要の理由
Studentのt検定 必要 分母に共通分散を使用するため、分散が等しいことが前提
Welchのt検定 不要 分散が異なることを考慮した検定で、分散を別々に扱うため
Mann-Whitney検定 不要 ノンパラメトリック手法[1]で順位に基づくため、等分散性や正規性は前提としない
ANOVA(分散分析) 必要 分散の均一性(等分散性)が前提、分散が等しくないと第1種の過誤が増える
WelchのANOVA 不要 分散が異なる群を比較するための分散分析手法で、等分散性は前提としない
回帰分析(OLS) 必要 誤差項の分散が一定(等分散性)であることが前提、これが満たされないと推定量の分散が誤る

等分散性を満たさないときはどうすればいいか?

  • 等分散性が不要な手法やノンパラメトリック検定に切り替える
    Welchのt検定、WelchのANOVA、 Mann-WhitneyのU検定、Kruskal-Wallis検定等
  • 変数の変換(分散を均質にする)::対数変換[2]、平方根変換[3]、Box-Cox変換[4]など
  • ロバスト推定法・ブートストラップ[5]手法を使う:Huber推定など

代表的な検定手法とその使い分け

手法 特徴 比較する群数 正規性 外れ値耐性 推奨シーン
F検定 2群の分散比を検定 2群 必要 弱い 2群のt検定前(正規性あり)
Bartlett検定 精度が高いが正規性に非常に敏感 2群以上(2群の場合はF検定で十分のため3群以上で使われる) 必要 弱い 正規性が保証される実験データ向き
Levene検定 中央値や平均からの偏差ベース 2群以上 不要 中程度 実務全般、ANOVAの前処理としてよく使われる
Brown-Forsythe検定 Levene検定の中央値ベース版 2群以上 不要 強い 外れ値があるデータでの頑健な検定
Fligner-Killeen検定 順位に基づく検定で最もロバスト 2群以上 不要 非常に強い 分布不明、外れ値が多い場合

注意点・落とし穴

  • 正規性が前提の手法に注意
    F検定・Bartlett検定等の正規性が前提の手法を使うと、有意性が誤って出やすくなる
  • 外れ値の影響を考慮すべし
    外れ値に弱い手法もあるため、箱ひげ図やIQRなどで外れ値有無をチェックしたうえで
    手法を検討すべき
  • 帰無仮説(=等分散である)のとらえ方に注意
    帰無仮説が棄却できない場合「等分散性がないとは言えない」、棄却の場合は「等分散性があるとは言えないが、ないとも言えない」と積極的に証明されたわけではないため、解釈を断定しない
    (こういった事情もありWelchのt検定が最初から使用されやすい)
  • 小サンプルの場合検出力が低くなる:差があっても見逃す可能性あり(目安: n > 30)
  • 複数群で等分散性がわかっても2群間の等分散性は保証されない
    全体として等分散かを検定するため、3群あった際にAvsBだけが等分散とは限らない

まとめ:等分散性検定の選び方

  • 3つの観点で使い分ける!
    ① 群の数
    → 2群:F、Levene、Brown-Forsythe、Fligner /
      3群以上:Bartlett、Levene、Brown-Forsythe、Fligner

    ② 正規性の有無
    → ある:F検定、Bartlett検定 / ない:Levene、Brown-Forsythe、Fligner

    ③ 外れ値への耐性
    → 弱い:F、Bartlett / 中:Levene / 強:Fligner、Brown-Forsythe

関連記事

https://support.minitab.com/ja-jp/minitab/help-and-how-to/statistics/basic-statistics/supporting-topics/tests-of-proportions-and-variances/bonett-s-method-or-levene-s-method/
https://data-science.gr.jp/theory/tst_levene_test.html

脚注
  1. データが特定の分布(例:正規分布)に従っているという仮定を必要としない統計的検定 ↩︎

  2. データの各値に対して、対数(通常は自然対数)を取ることで、データの分布を正規分布に近づけたり、ばらつきを減らすための変換 ↩︎

  3. データの各値に対して、平方根を付けることで、ばらつきを減らすための変換 ↩︎

  4. パラメータλを使ってデータを調整することで、対数変換より柔軟に、正規分布に近づけるための変換 ↩︎

  5. 標本データから繰り返し再抽出して、統計量の分布を推定する方法。 ↩︎

Discussion