📖

【実験計画法・完全攻略】第2話:分散分析って何?─ バラつきを分解する魔法

に公開

前回のあらすじ

食品メーカー勤務の美咲(27歳・文系)は、新商品グラノーラの開発で「実験計画法」を使うよう指示された。相棒のAIロボット「ロボ助」から、3つの原則(局所管理化・反復・無作為化)を学んだ。

今日は、実験結果をどう分析するかを学ぶ。


第1章:土曜日の朝、分析編スタート

土曜日の朝9時。美咲は自宅でロボ助を起動した。

「おはようございます、美咲さん。二日酔いですか?」

「失礼ね、ちゃんと早く寝たわよ...。昨日の続き、教えて」

「では本日は分散分析を学びましょう」

「ぶんさん...ぶんせき...?」

「**ANOVA(アノーバ)**とも呼ばれます。Analysis of Varianceの略です」


第2章:分散分析 ─ 「バラつきの犯人捜し」

「美咲さん、試作したグラノーラ12個の美味しさスコアがこれです」

【試作グラノーラの美味しさスコア(100点満点)】

レシピA(オーツ麦多め):85, 82, 88, 79  → 平均 83.5
レシピB(ナッツ多め)  :72, 75, 70, 73  → 平均 72.5
レシピC(蜂蜜多め)    :90, 88, 92, 86  → 平均 89.0

全体平均:81.7

「レシピCが一番美味しそう!」

「でも、その差は**『レシピの違い』のせいですか?『偶然のバラつき』のせいですか?**」

「......」

「それを判断するのが分散分析です。バラつきを『原因別』に分解するんです」

【分散分析のイメージ】

   全体のバラつき
   ┌────────────────────────────────────────┐
   │████████████████████████████████████████│
   └────────────────────────────────────────┘
                      ↓ 分解する
   
   レシピの違いによるバラつき    偶然のバラつき
   ┌────────────────────────┐  ┌──────────────┐
   │████████████████████████│  │██████████████│
   └────────────────────────┘  └──────────────┘
        (群間変動)              (群内変動)

「バラつきの『犯人捜し』みたいな?」

まさにそれ。『レシピの違い』がバラつきの主犯なら、レシピを変える意味がある。『偶然』が主犯なら、どのレシピでも大差ないということ」


第3章:F値 ─ 「犯人を追い詰める証拠」

「で、どうやって犯人を特定するの?」

F値という指標を計算します」

【F値の計算式】

              レシピの違いによるバラつき
   F値   =   ─────────────────────────────
                  偶然のバラつき

   F値が大きい → レシピの影響が大きい(有意な差あり)
   F値が小さい → 偶然の範囲内(有意な差なし)

「F値が大きければ、『レシピが犯人』ってこと?」

「そうです。F値が一定の基準(F分布の臨界値)を超えたら、『これは偶然とは思えない、レシピの違いが原因だ』と結論づけます」

【今回のグラノーラの分析結果】

   F値 = 28.5(かなり大きい)
   p値 = 0.0001(めちゃくちゃ小さい)

   結論:レシピの違いは統計的に有意
        → レシピCが本当に美味しい!(偶然じゃない)

「やった! レシピCで決まりね!」

「ちょっと待ってください。まだ話の途中です」


第4章:一元配置と多元配置 ─ 「容疑者は1人か、複数か」

「さっきの分析は一元配置分散分析と呼ばれます」

「いちげん...?」

『元』は『要因』の数です。さっきは『レシピ』という1つの要因だけを調べたから『一元』」

【一元配置分散分析】

   調べる要因:1つだけ

   例:「レシピの違い」だけを調べる

   ┌─────────────────────────────────────┐
   │                                     │
   │      要因:レシピ                    │
   │        ↓                           │
   │   ┌────┬────┬────┐                │
   │   │ A  │ B  │ C  │  → 結果        │
   │   └────┴────┴────┘                │
   │                                     │
   └─────────────────────────────────────┘

「じゃあ二元配置は、要因が2つ?」

正解。グラノーラなら『レシピ』と『焼き時間』の2つを同時に調べられます」

【二元配置分散分析】

   調べる要因:2つ

   例:「レシピ」と「焼き時間」を同時に調べる

   ┌─────────────────────────────────────────────┐
   │                                             │
   │              焼き時間                        │
   │          短い   普通   長い                 │
   │        ┌─────┬─────┬─────┐               │
   │   レ A │ 75  │ 82  │ 80  │               │
   │   シ B │ 70  │ 73  │ 78  │               │
   │   ピ C │ 85  │ 90  │ 88  │               │
   │        └─────┴─────┴─────┘               │
   │                                             │
   │   → レシピの影響と焼き時間の影響を        │
   │     同時に分析できる!                     │
   │                                             │
   └─────────────────────────────────────────────┘

「要因が3つ以上なら?」

多元配置と呼びます。3つでも4つでも、原理は同じです」


第5章:交互作用 ─ 「共犯関係」を見抜く

「二元配置のメリットは、交互作用がわかることです」

「こうご...さよう...?」

2つの要因が『組み合わさって』初めて効果を発揮する現象です」

美咲は首をかしげた。

「グラノーラで例えましょう。レシピCは蜂蜜多め。焼き時間が短いと蜂蜜がトロッと残って美味しい。でも長く焼くと焦げて苦くなる」

「あー、わかる! 蜂蜜は焼きすぎると焦げるもんね」

「つまり、『レシピC』と『焼き時間・長い』の組み合わせが悪い。これが交互作用です」

【交互作用のイメージ】

   交互作用がない場合(単純に足し算)
   
   美味しさ
     │
   90┤         C(蜂蜜多め)
     │       /
   80┤     /   B(ナッツ多め)
     │   /   /
   70┤ /   /   A(オーツ多め)
     │   /
     └─────────────────
       短い   普通   長い  焼き時間

   → どのレシピも「長く焼くほど美味しい」という単純な関係


   交互作用がある場合(組み合わせで変わる)
   
   美味しさ
     │
   90┤    __C    ← 途中まで上がるが...
     │   /   \
   80┤  /     \  ← 長く焼くと急降下!
     │ /    B
   70┤      /
     │  A /
     └─────────────────
       短い   普通   長い  焼き時間

   → レシピCだけ「長く焼くと逆効果」という特殊な関係

「これ、一元配置だと見つけられないの?」

「見つけられません。一元配置では『レシピの効果』と『焼き時間の効果』を別々にしか見れない。二元配置なら『組み合わせの効果』も見える」


第6章:今日の学びを整理

「ちょっと休憩...頭がパンクしそう」

美咲はコーヒーを淹れながら、今日の学びをまとめた。

┌─────────────────────────────────────────────────────┐
│                                                     │
│   【分散分析(ANOVA)まとめ】                       │
│                                                     │
│   ● 分散分析とは                                   │
│     バラつきを「要因ごと」に分解して              │
│     「本当に差があるか」を判断する手法            │
│                                                     │
│   ● 一元配置 vs 多元配置                          │
│     一元配置:要因が1つ(レシピだけ調べる)       │
│     多元配置:要因が2つ以上(レシピ×焼き時間)    │
│                                                     │
│   ● 交互作用                                       │
│     2つの要因が「組み合わさって」効果を発揮する   │
│     現象。多元配置でないと発見できない。          │
│                                                     │
└─────────────────────────────────────────────────────┘

語呂合わせで覚える

「語呂合わせも作っておきますね」

┌─────────────────────────────────────────────────────┐
│                                                     │
│   【本日の語呂合わせ】                              │
│                                                     │
│   ● 分散分析                                       │
│     →「バラバラを分けて犯人逮捕」                  │
│                                                     │
│   ● 一元配置                                       │
│     →「一人の容疑者を取り調べ」                    │
│                                                     │
│   ● 多元配置                                       │
│     →「多人数を一斉取り調べ」                      │
│                                                     │
│   ● 交互作用                                       │
│     →「共犯関係を暴く」                            │
│                                                     │
└─────────────────────────────────────────────────────┘

「犯罪捜査みたいで覚えやすい...」


第2話のまとめ

用語 意味 覚え方
分散分析 バラつきを要因別に分解して差を検定 バラバラを分けて犯人逮捕
一元配置 1つの要因だけ調べる 一人の容疑者を取り調べ
多元配置 複数の要因を同時に調べる 多人数を一斉取り調べ
交互作用 要因の組み合わせで起きる特殊な効果 共犯関係を暴く

次回予告

「108通りの組み合わせを、もっと減らせないの?」

次回、ロボ助が直交表という最強の効率化ツールを伝授する。

第3話:直交表と最適計画 ─ 「最小の実験で最大の成果を」へ続く

https://zenn.dev/rick_lyric/articles/c814f34520b3bc


この記事が役に立ったら、フォローしていただけると励みになります。

Discussion