はじめに
この記事では、統計検定準1級取得に向けて学習したことをまとめていきます。
工学系の数学ではなく数理あるあるの、論述ゴリゴリな解答になっていると思いますのであらかじめご了承ください。
注意:さらに計算過程は数学文化の『省略の美』を無視してエレファントに書いています。
【リンク紹介】
・統計検定準1級のまとめ記事一覧
・これまで書いたシリーズ記事一覧
学習書籍について
この記事では「統計学実践ワークブック」を中心に、学んだことをまとめていきます。記事を読んで本格的に勉強してみたいなと思った方は、是非ご購入を検討なさってください。
参考書籍について
統計実践ワークブックは、大量の知識項目と問題が収められている反面、計算過程や知識背景が大きく省略されているため、知識体系をきちんと学ぶ参考書として東京大学から出版されている名著「統計学入門」を使っています。
※ワークブックとしては素晴らしい質だと思いますが、どうしてもその内容量とページ数の都合上、問題のない範囲で削除されているということです。人によっては1冊で問題ない方もおられると思いますが、私には無理でした。
定義
a, b, c \hspace{2.6mm} :定数
x, y \hspace{5mm} :変数
X, Y \hspace{2.9mm} :確率変数
p(x) \hspace{4mm} :Xの確率関数
f(x) \hspace{3.6mm} :Xの確率密度関数
p(x, y) \hspace{0.4mm} :XとYの同時確率関数
f(x, y) \hspace{0mm} :XとYの同時確率密度関数
E[X] \hspace{2.1mm} :Xの期待値
V[X] \hspace{2mm} :Xの分散
分散の性質
- V[c] = 0
- V[X + c] = V[X]
- V[aX] = a^2 V[X]
- V[aX + b] = a^2 V[X]
-
XとYが独立でないとき、
V[X + Y] = V[X] + V[Y] + 2 Cov(X, Y)
-
XとYが独立であるとき、
V[X + Y] = V[X] + V[Y]
- V[X] = E[X^2] - (E[X])^2
証明
※一般的な証明は、もっと簡単でスマートなものが多いですが、この記事では分散の定義に基づいて証明を行っていきたいと思います。
- V[c] = 0
(離散型のとき)
\begin{alignat*}{2}
V[c] &= \sum_{i = 1}^{\infty} (c - E[c])^2 p(x_i) \\
&= \sum_{i = 1}^{\infty} (c - c)^2 p(x_i) \\
&= \sum_{i = 1}^{\infty} 0 \cdot p(x_i) \\
&= 0
\end{alignat*}
(連続型のとき)
\begin{alignat*}{2}
V[c] &= \int_{- \infty}^{\infty} (c - E[c])^2 f(x) dx \\
&= \int_{- \infty}^{\infty} (c - c)^2 f(x) dx \\
&= \int_{- \infty}^{\infty} 0 \cdot f(x) dx \\
&= 0 \\
\end{alignat*}
- V[X + c] = V[X]
(離散型のとき)
\begin{alignat*}{2}
V[X + c] &= \sum_{i = 1}^{\infty} ((x_i + c) - E[X + c])^2 p(x_i) \\
&= \sum_{i = 1}^{\infty} ((x_i + c) - (E[X] + c))^2 p(x_i) \\
&= \sum_{i = 1}^{\infty} (x_i - E[X])^2 p(x_i) \\
&= V[X]
\end{alignat*}
(連続型のとき)
\begin{alignat*}{2}
V[X + c] &= \sum_{i = 1}^{\infty} ((x + c) - E[X + c])^2 f(x) dx \\
&= \sum_{i = 1}^{\infty} ((x + c) - (E[X] + c))^2 f(x) dx \\
&= \sum_{i = 1}^{\infty} (x - E[X])^2 f(x) dx \\
&= V[X] \\
\end{alignat*}
- V[aX] = a^2 V[X]
(離散型のとき)
\begin{alignat*}{2}
V[aX] &= \sum_{i = 1}^{\infty} (ax_i - E[aX])^2 p(x_i) \\
&= \sum_{i = 1}^{\infty} (ax_i - aE[X])^2 p(x_i) \\
&= \sum_{i = 1}^{\infty} a^2 (x_i - E[X])^2 p(x_i) \\
&= a^2 \sum_{i = 1}^{\infty} (x_i - E[X])^2 p(x_i) \\
&= a^2 V[X]
\end{alignat*}
(連続型のとき)
\begin{alignat*}{2}
V[aX] &= \int_{- \infty}^{\infty} (ax - E[aX])^2 f(x) dx \\
&= \int_{- \infty}^{\infty} (ax - aE[X])^2 f(x) dx \\
&= \int_{- \infty}^{\infty} a^2 (x - E[X])^2 f(x) dx \\
&= a^2 \int_{- \infty}^{\infty} (x - E[X])^2 f(x) dx \\
&= a^2 V[X]
\end{alignat*}
- V[aX + b] = a^2 V[X]
(離散型のとき)
\begin{alignat*}{2}
V[aX + b] &= \sum_{i = 1}^{\infty} ((ax_i + b) - E[aX + b])^2 p(x_i) \\
&= \sum_{i = 1}^{\infty} ((ax_i + b) - (aE[X] + b))^2 p(x_i) \\
&= \sum_{i = 1}^{\infty} a^2 (x_i - E[X])^2 p(x_i) \\
&= a^2 \sum_{i = 1}^{\infty} (x_i - E[X])^2 p(x_i) \\
&= a^2 V[X] \\
\end{alignat*}
(連続型のとき)
\begin{alignat*}{2}
V[aX + b] &= \int_{\infty}^{\infty} ((ax_i + b) - E[aX + b])^2 f(x) dx \\
&= \int_{\infty}^{\infty} ((ax_i + b) - (aE[X] + b))^2 f(x) dx \\
&= \int_{\infty}^{\infty} a^2 (x_i - E[X])^2 f(x) dx \\
&= a^2 \int_{\infty}^{\infty} (x_i - E[X])^2 f(x) dx \\
&= a^2 V[X] \\
\end{alignat*}
-
XとYが独立でないとき、
V[X + Y] = V[X] + V[Y] + 2 Cov(X, Y)
(離散型のとき)
\begin{alignat*}{2}
V[X + Y] &= \sum_{i = 1}^{\infty} \sum_{j = 1}^{\infty}
((x_i + y_j) - E[X + Y])^2 p(x_i, x_j) \\
&= \sum_{i = 1}^{\infty} \sum_{j = 1}^{\infty}
((x_i + y_j)^2 - 2(x_i + y_j)E[X + Y] + (E[X + Y])^2) p(x_i, x_j) \\
\end{alignat*}
ここで、
\begin{alignat*}{2}
& (x_i + y_j)^2 - 2(x_i + y_j)E[X + Y] + (E[X + Y])^2 \\
=& ({x_i}^2 + 2x_j y_j + {y_j}^2)
- 2(x_i E[X] + x_i E[Y] + y_j E[X] + y_j E[Y])
+ ((E[X])^2 + 2E[X]E[Y] + (E[Y])^2) \\
=& (x_i - E[X])^2
+ (y_j - E[Y])^2
+ 2(x_i - E[X])(y_j - E[Y])
\end{alignat*}
より、
\begin{alignat*}{2}
V[X + Y] &= \sum_{i = 1}^{\infty} \sum_{j = 1}^{\infty} (x_i - E[X])^2 p(x_i, y_j)
+ \sum_{i = 1}^{\infty} \sum_{j = 1}^{\infty} (y_j - E[Y])^2 p(x_i, y_j)
+ \sum_{i = 1}^{\infty} \sum_{j = 1}^{\infty} 2(x_i - E[X])(y_j - E[Y]) p(x_i, y_j) \\
&= \sum_{i = 1}^{\infty} (x_i - E[X])^2
\left(
\sum_{j = 1}^{\infty} p(x_i, y_j)
\right)
+ \sum_{j = 1}^{\infty} (y_j - E[Y])^2
\left(
\sum_{i = 1}^{\infty} p(x_i, y_j)
\right)
+ 2E[(X - E[X])(Y - E[Y])] \\
&= \sum_{i = 1}^{\infty} (x_i - E[X])^2 p_X (x_i, y_j)
+ \sum_{j = 1}^{\infty} (y_j - E[Y])^2 p_Y (x_i, y_j)
+ 2 Cov(X, Y) \\
&= V[X] + V[Y] + 2 Cov(X, Y)
\end{alignat*}
(連続型のとき)
\begin{alignat*}{2}
V[X + Y] &= \int_{-\infty}^{\infty} \int_{-\infty}^{\infty}
((x + y) - E[X + Y])^2 f(x, y) dx dy \\
&= \int_{-\infty}^{\infty} \int_{-\infty}^{\infty}
(x - E[X])^2 f(x, y) dx dy
+ \int_{-\infty}^{\infty} \int_{-\infty}^{\infty}
(y - E[Y])^2 f(x, y) dx dy
+ \int_{-\infty}^{\infty} \int_{-\infty}^{\infty}
2(x - E[X])(y - E[Y]) f(x, y) dx dy \\
&= \int_{-\infty}^{\infty} (x - E[X])^2
\left(
\int_{-\infty}^{\infty} f(x, y) dy
\right)dx
+ \int_{-\infty}^{\infty} (y - E[Y])^2
\left(
f(x, y) dx
\right) dy
+ 2E[(X - E[X])(Y - E[Y])] \\
&= \int_{-\infty}^{\infty} (x - E[X])^2 f_X (x, y) dx
+ \int_{-\infty}^{\infty} (y - E[Y])^2 f_Y (x, y) dy
+ 2 Cov(X, Y) \\
&= V[X] + V[Y] + 2 Cov(X, Y)
\end{alignat*}
-
XとYが独立であるとき、
V[X + Y] = V[X] + V[Y]
Cov[X, Y] = 0であるから5.より
\begin{alignat*}{2}
V[X + Y] &= V[X] + V[Y] + 2 Cov(X, Y) \\
&= V[X] + V[Y] + 0 \\
&= V[X] + V[Y] \\
\end{alignat*}
- V[X] = E[X^2] - (E[X])^2
(離散型のとき)
\begin{alignat*}{2}
V[X] &= \sum_{i = 1}^{\infty} (x_i - E[X])^2 p(x_i) \\
&= \sum_{i = 1}^{\infty} ((x_i)^2 - 2x_i E[X] + (E[X])^2) p(x_i) \\
&= \sum_{i = 1}^{\infty} {x_i}^2 p(x_i)
- 2 E[X] \sum_{i = 1}^{\infty} x_i p(x_i)
+ (E[X])^2 \sum_{i = 1}^{\infty} p(x_i) \\
&= E[X^2] - 2(E[X])^2 + (E[X])^2 \\
&= E[X^2] - (E[X])^2
\end{alignat*}
(連続型のとき)
\begin{alignat*}{2}
V[X] &= \int_{-\infty}^{\infty} (x_i - E[X])^2 f(x) dx \\
&= \int_{-\infty}^{\infty} ((x_i)^2 - 2x_i E[X] + (E[X])^2) f(x) dx \\
&= \int_{-\infty}^{\infty} {x_i}^2 f(x) dx
- 2 E[X] \int_{-\infty}^{\infty} x_i f(x) dx
+ (E[X])^2 \int_{-\infty}^{\infty} f(x) dx \\
&= E[X^2] - 2(E[X])^2 + (E[X])^2 \\
&= E[X^2] - (E[X])^2
\end{alignat*}
参考資料
\bf{\textcolor{red}{記事が役に立った方は「いいね」を押していただけると、すごく喜びます \ 笑}}
ご協力のほどよろしくお願いします☆
Discussion