はじめに
統計検定準一級の2021年の過去問を解いていたところ問6の[1]の詳しい解説が見つからなかったため書くことにしました.問題そのものを書くことは著作権上できないので回答部分のみ記載します.この問題のキーワードは「平方和の分解」です.計算途中のテクニックとしては,途中でグループ内の平均を敢えて足し引きさせることだと思います.
回答
S = \frac{1}{n} \sum_{i}^{n}(\bold{z_{i}}-\bar{\bold{z}})(\bold{z_{i}}-\bar{\bold{z}})^{\top} = \frac{1}{n} \sum_{i}^{n_{1}}(\bold{x_{i}}-\bar{\bold{z}})(\bold{x_{i}}-\bar{\bold{z}})^{\top} + \frac{1}{n} \sum_{i}^{n_{2}}(\bold{y_{i}}-\bar{\bold{z}})(\bold{y_{i}}-\bar{\bold{z}})^{\top}
\bold{x_{i}}と\bold{y_{i}}は,グループ1,グループ2におけるi番目の実験データである.\bold{x}と\bold{y}の集合は排反であるので,上の式のように和を分解することができる.(n = n_{1} + n_{2})右辺第1項について以下のように変形できる.
\begin{aligned}
\frac{1}{n} \sum_{i}^{n_{1}}(\bold{x_{i}}-\bar{\bold{z}})(\bold{x_{i}}-\bar{\bold{z}})^{\top} &= \frac{1}{n} \sum_{i}^{n_{1}}\{(\bold{x_{i}} -\bar{\bold{x}}) + (\bar{\bold{x}} -\bar{\bold{z}})\}\{(\bold{x_{i}} -\bar{\bold{x}}) + (\bar{\bold{x}} -\bar{\bold{z}})\}^{\top} \\
&= \frac{1}{n} \sum_{i}^{n_{1}}\{(\bold{x_{i}} -\bar{\bold{x}}) + (\bar{\bold{x}} -\bar{\bold{z}})\}\{(\bold{x_{i}} -\bar{\bold{x}})^{\top} + (\bar{\bold{x}} -\bar{\bold{z}})^{\top}\} \\
&= \frac{1}{n} \sum_{i}^{n_{1}}(\bold{x_{i}} -\bar{\bold{x}})\bold{(x_{i}} -\bar{\bold{x}})^{\top} \\
&+ \frac{2}{n} \sum_{i}^{n_{1}}(\bar{\bold{x}} -\bar{\bold{z}})(\bold{x_{i}} -\bar{\bold{x}})^{\top} + \frac{1}{n} \sum_{i}^{n_{1}}(\bar{\bold{x}} -\bar{\bold{z}})(\bar{\bold{x}} -\bar{\bold{z}})^{\top} \\
&= \frac{n_{1}}{n}S_{1} + \frac{n_{1}}{n}(\bar{\bold{x}} -\bar{\bold{z}})(\bar{\bold{x}} -\bar{\bold{z}})^{\top}
\end{aligned}
3行目から4行目への,\frac{2}{n} \sum_{i}^{n_{1}}(\bar{\bold{x}} -\bar{\bold{z}})(\bold{x_{i}} -\bar{\bold{x}})^{\top}=0に関する式変形は以下のようになっている.
\begin{aligned}
\frac{2}{n} \sum_{i}^{n_{1}}(\bar{\bold{x}} -\bar{\bold{z}})(\bold{x_{i}} -\bar{\bold{x}})^{\top} &= \frac{2}{n} (\bar{\bold{x}} -\bar{\bold{z}})(\sum_{i}^{n_{1}}\bold{x_{i}} -n_{1}\bar{\bold{x}})^{\top} \\
&=\frac{2}{n} (\bar{\bold{x}} -\bar{\bold{z}})(n_{1}\bar{\bold{x}} -n_{1}\bar{\bold{x}})^{\top} \\
&= 0
\end{aligned}
ここまでの式変形を,Sの式右辺第2項\frac{1}{n} \sum_{i}^{n_{2}}(\bold{y_{i}}-\bar{\bold{z}})(\bold{y_{i}}-\bar{\bold{z}})^{\top}に対しても行うと,
\frac{1}{n} \sum_{i}^{n_{2}}(\bold{y_{i}}-\bar{\bold{z}})(\bold{y_{i}}-\bar{\bold{z}})^{\top} = \frac{n_{2}}{n}S_{2} + \frac{n_{2}}{n}(\bar{\bold{y}} -\bar{\bold{z}})(\bar{\bold{y}} -\bar{\bold{z}})^{\top}
すなわち,
\begin{aligned}
S &= \frac{1}{n} \sum_{i}^{n}(\bold{z_{i}}-\bar{\bold{z}})(\bold{z_{i}}-\bar{\bold{z}})^{\top} \\
&= \frac{1}{n} \sum_{i}^{n_{1}}(\bold{x_{i}}-\bar{\bold{z}})(\bold{x_{i}}-\bar{\bold{z}})^{\top} + \frac{1}{n} \sum_{i}^{n_{2}}(\bold{y_{i}}-\bar{\bold{z}})(\bold{y_{i}}-\bar{\bold{z}})^{\top} \\
&= \frac{n_{1}}{n}S_{1} + \frac{n_{1}}{n}(\bar{\bold{x}} -\bar{\bold{z}})(\bar{\bold{x}} -\bar{\bold{z}})^{\top} + \frac{n_{2}}{n}S_{2} + \frac{n_{2}}{n}(\bar{\bold{y}} -\bar{\bold{z}})(\bar{\bold{y}} -\bar{\bold{z}})^{\top} \\
&= S_{W} + S_{B}
\end{aligned}
となる.
おわりに
第三者からのチェックを受けていませんので,式変形ミスなどありましたらご指摘いただけると大変嬉しいです.また,勉強進度に合わせてこの記事もしくは別記事で追記していこうと思います.
参考文献
https://wakara.co.jp/mathlog/20210813
Discussion