📊
ケーススタディ:学習効果の評価|対応のある2群の差
はじめに
教育やマーケティングの現場では、“施策の効果検証”が求められる場面が多くあります。
この記事では、UCIの「Student Performance Data Set」を用いて学習前後の成績変化を分析し、施策の効果を統計的に検証するプロセスを紹介します。
分析目的
1年間のG1(1回目の成績)とG3(最終成績)の成績に有意な差があるか検定し、
学習の効果を統計的に確認する
使用データ
- データセット:Student Performance Data Set(UCI Machine Learning Repository)
- ポルトガル語の授業を受けた学生
- サンプル数:649ペア
- 変数:
- G1:1回目の成績(施策前)
- G3:最終成績(施策後)
使用手法
- Shapiro-Wilk検定(正規性の確認)
- Anderson-Darling検定(正規性の確認)
- 対応のあるt検定(対応のある2群の差 パラメトリック検定)
- Wilcoxonの符号付順位検定(対応のある2群の差 ノンパラメトリック検定)
分析ステップ
ステップ1:データの基礎俯瞰
- 欠損値:なし
- データ型:int
-
ヒストグラム
G1とG3でぱっと見は似てるが、G3のほうが高い点の人が多く、0点近くの件数も多い
-
箱ひげ図
中央値はG3のほうが大きい、全体的にG3のほうが点数高めの印象
ステップ2:正規性の確認
-
Shapiro-Wilk検定 → 手法の説明はこちら
- W値:0.811 p値:7.11e-27
- 設定有意水準:0.05
- 帰無仮説:棄却
- 解釈:正規分布に従うとみなせない
n>100では検定が厳しくなってしまうため、Anderson-Darling検定も併用
-
Anderson-Darling検定 → 手法の説明はこちら
- AD検定統計量:27.071
- 設定有意水準:0.05 臨界値:0.782
- 帰無仮説:棄却できない
- 解釈:正規分布に従うとみなせる(厳密には「従わないといえない」)
-
Q-Qプロット
中央付近(0付近)は点が赤線にほぼ沿っている → 中央の分布は正規分布と近い形
両端が理想線(赤線)から大きく逸れている → 外れ値がやや多い可能性がある -
ヒストグラム
横軸が約0.8付近を中心にほぼ左右対称のベル型になっている → 中央付近(-5~5)は正規分布と近い形
両端(-10,10付近)に外れ値が散見される → 正規分布とのずれがあるかもしれない
ステップ3:対応のある2群の差検定 実施
正規性検定の際に「Shapiro-Wilk検定:正規分布に従うとみなせない」「Anderson-Darling検定:正規分布に従うとみなせる」となったため、対応のあるt検定とWilcoxonの符号付順位検定の両方で評価
-
対応のあるt検定 → 手法の説明はこちら
- t値:-7.093 p値:3.45e-12
- 設定有意水準:0.05(両側検定)
- 帰無仮説:棄却
- 解釈:G1とG3で有意な差がある
-
Wilcoxonの符号付順位検定 → 手法の説明はこちら
- W値:25595.500 p値:5.58e-24
- 設定有意水準:0.05(両側検定)
- 帰無仮説:棄却
- 解釈:G1とG3で有意な差がある
示唆と次のアクション
- 分析結果:G1とG3で統計的に有意な差がみられた
- 今回の示唆:学期中の学習活動や指導によって、生徒の成績に何らかの変化が生じたと考える
-
Next分析案:
- 差の方向(点数が上がったか下がったか)をさらに確認
- 学生の属性深堀
- 効果量の測定
-
ビジネスアクション案
- 成績が上がった/下がった学習活動や指導を特定し、成功/失敗パターンとして横展開
- 成績が上がった/下がった学生属性・行動を分析し、個別最適化学習や人材育成戦略へ応用
Discussion