【実験計画法・完全攻略】第2話:分散分析って何?─ バラつきを分解する魔法
前回のあらすじ
食品メーカー勤務の美咲(27歳・文系)は、新商品グラノーラの開発で「実験計画法」を使うよう指示された。相棒のAIロボット「ロボ助」から、3つの原則(局所管理化・反復・無作為化)を学んだ。
今日は、実験結果をどう分析するかを学ぶ。
第1章:土曜日の朝、分析編スタート
土曜日の朝9時。美咲は自宅でロボ助を起動した。
「おはようございます、美咲さん。二日酔いですか?」
「失礼ね、ちゃんと早く寝たわよ...。昨日の続き、教えて」
「では本日は分散分析を学びましょう」
「ぶんさん...ぶんせき...?」
「**ANOVA(アノーバ)**とも呼ばれます。Analysis of Varianceの略です」
第2章:分散分析 ─ 「バラつきの犯人捜し」
「美咲さん、試作したグラノーラ12個の美味しさスコアがこれです」
【試作グラノーラの美味しさスコア(100点満点)】
レシピA(オーツ麦多め):85, 82, 88, 79 → 平均 83.5
レシピB(ナッツ多め) :72, 75, 70, 73 → 平均 72.5
レシピC(蜂蜜多め) :90, 88, 92, 86 → 平均 89.0
全体平均:81.7
「レシピCが一番美味しそう!」
「でも、その差は**『レシピの違い』のせいですか?『偶然のバラつき』のせいですか?**」
「......」
「それを判断するのが分散分析です。バラつきを『原因別』に分解するんです」
【分散分析のイメージ】
全体のバラつき
┌────────────────────────────────────────┐
│████████████████████████████████████████│
└────────────────────────────────────────┘
↓ 分解する
レシピの違いによるバラつき 偶然のバラつき
┌────────────────────────┐ ┌──────────────┐
│████████████████████████│ │██████████████│
└────────────────────────┘ └──────────────┘
(群間変動) (群内変動)
「バラつきの『犯人捜し』みたいな?」
「まさにそれ。『レシピの違い』がバラつきの主犯なら、レシピを変える意味がある。『偶然』が主犯なら、どのレシピでも大差ないということ」
第3章:F値 ─ 「犯人を追い詰める証拠」
「で、どうやって犯人を特定するの?」
「F値という指標を計算します」
【F値の計算式】
レシピの違いによるバラつき
F値 = ─────────────────────────────
偶然のバラつき
F値が大きい → レシピの影響が大きい(有意な差あり)
F値が小さい → 偶然の範囲内(有意な差なし)
「F値が大きければ、『レシピが犯人』ってこと?」
「そうです。F値が一定の基準(F分布の臨界値)を超えたら、『これは偶然とは思えない、レシピの違いが原因だ』と結論づけます」
【今回のグラノーラの分析結果】
F値 = 28.5(かなり大きい)
p値 = 0.0001(めちゃくちゃ小さい)
結論:レシピの違いは統計的に有意
→ レシピCが本当に美味しい!(偶然じゃない)
「やった! レシピCで決まりね!」
「ちょっと待ってください。まだ話の途中です」
第4章:一元配置と多元配置 ─ 「容疑者は1人か、複数か」
「さっきの分析は一元配置分散分析と呼ばれます」
「いちげん...?」
「『元』は『要因』の数です。さっきは『レシピ』という1つの要因だけを調べたから『一元』」
【一元配置分散分析】
調べる要因:1つだけ
例:「レシピの違い」だけを調べる
┌─────────────────────────────────────┐
│ │
│ 要因:レシピ │
│ ↓ │
│ ┌────┬────┬────┐ │
│ │ A │ B │ C │ → 結果 │
│ └────┴────┴────┘ │
│ │
└─────────────────────────────────────┘
「じゃあ二元配置は、要因が2つ?」
「正解。グラノーラなら『レシピ』と『焼き時間』の2つを同時に調べられます」
【二元配置分散分析】
調べる要因:2つ
例:「レシピ」と「焼き時間」を同時に調べる
┌─────────────────────────────────────────────┐
│ │
│ 焼き時間 │
│ 短い 普通 長い │
│ ┌─────┬─────┬─────┐ │
│ レ A │ 75 │ 82 │ 80 │ │
│ シ B │ 70 │ 73 │ 78 │ │
│ ピ C │ 85 │ 90 │ 88 │ │
│ └─────┴─────┴─────┘ │
│ │
│ → レシピの影響と焼き時間の影響を │
│ 同時に分析できる! │
│ │
└─────────────────────────────────────────────┘
「要因が3つ以上なら?」
「多元配置と呼びます。3つでも4つでも、原理は同じです」
第5章:交互作用 ─ 「共犯関係」を見抜く
「二元配置のメリットは、交互作用がわかることです」
「こうご...さよう...?」
「2つの要因が『組み合わさって』初めて効果を発揮する現象です」
美咲は首をかしげた。
「グラノーラで例えましょう。レシピCは蜂蜜多め。焼き時間が短いと蜂蜜がトロッと残って美味しい。でも長く焼くと焦げて苦くなる」
「あー、わかる! 蜂蜜は焼きすぎると焦げるもんね」
「つまり、『レシピC』と『焼き時間・長い』の組み合わせが悪い。これが交互作用です」
【交互作用のイメージ】
交互作用がない場合(単純に足し算)
美味しさ
│
90┤ C(蜂蜜多め)
│ /
80┤ / B(ナッツ多め)
│ / /
70┤ / / A(オーツ多め)
│ /
└─────────────────
短い 普通 長い 焼き時間
→ どのレシピも「長く焼くほど美味しい」という単純な関係
交互作用がある場合(組み合わせで変わる)
美味しさ
│
90┤ __C ← 途中まで上がるが...
│ / \
80┤ / \ ← 長く焼くと急降下!
│ / B
70┤ /
│ A /
└─────────────────
短い 普通 長い 焼き時間
→ レシピCだけ「長く焼くと逆効果」という特殊な関係
「これ、一元配置だと見つけられないの?」
「見つけられません。一元配置では『レシピの効果』と『焼き時間の効果』を別々にしか見れない。二元配置なら『組み合わせの効果』も見える」
第6章:今日の学びを整理
「ちょっと休憩...頭がパンクしそう」
美咲はコーヒーを淹れながら、今日の学びをまとめた。
┌─────────────────────────────────────────────────────┐
│ │
│ 【分散分析(ANOVA)まとめ】 │
│ │
│ ● 分散分析とは │
│ バラつきを「要因ごと」に分解して │
│ 「本当に差があるか」を判断する手法 │
│ │
│ ● 一元配置 vs 多元配置 │
│ 一元配置:要因が1つ(レシピだけ調べる) │
│ 多元配置:要因が2つ以上(レシピ×焼き時間) │
│ │
│ ● 交互作用 │
│ 2つの要因が「組み合わさって」効果を発揮する │
│ 現象。多元配置でないと発見できない。 │
│ │
└─────────────────────────────────────────────────────┘
語呂合わせで覚える
「語呂合わせも作っておきますね」
┌─────────────────────────────────────────────────────┐
│ │
│ 【本日の語呂合わせ】 │
│ │
│ ● 分散分析 │
│ →「バラバラを分けて犯人逮捕」 │
│ │
│ ● 一元配置 │
│ →「一人の容疑者を取り調べ」 │
│ │
│ ● 多元配置 │
│ →「多人数を一斉取り調べ」 │
│ │
│ ● 交互作用 │
│ →「共犯関係を暴く」 │
│ │
└─────────────────────────────────────────────────────┘
「犯罪捜査みたいで覚えやすい...」
第2話のまとめ
| 用語 | 意味 | 覚え方 |
|---|---|---|
| 分散分析 | バラつきを要因別に分解して差を検定 | バラバラを分けて犯人逮捕 |
| 一元配置 | 1つの要因だけ調べる | 一人の容疑者を取り調べ |
| 多元配置 | 複数の要因を同時に調べる | 多人数を一斉取り調べ |
| 交互作用 | 要因の組み合わせで起きる特殊な効果 | 共犯関係を暴く |
次回予告
「108通りの組み合わせを、もっと減らせないの?」
次回、ロボ助が直交表という最強の効率化ツールを伝授する。
第3話:直交表と最適計画 ─ 「最小の実験で最大の成果を」へ続く
この記事が役に立ったら、フォローしていただけると励みになります。
Discussion