はじめに
この記事では、統計検定準1級取得に向けて学習したことをまとめていきます。
工学系の数学ではなく数理あるあるの、論述ゴリゴリな解答になっていると思いますのであらかじめご了承ください。
注意:さらに計算過程は数学文化の『省略の美』を無視してエレファントに書いています。
【リンク紹介】
・統計検定準1級のまとめ記事一覧
・これまで書いたシリーズ記事一覧
学習書籍について
この記事では「統計学実践ワークブック」を中心に、学んだことをまとめていきます。記事を読んで本格的に勉強してみたいなと思った方は、是非ご購入を検討なさってください。
参考書籍について
統計実践ワークブックは、大量の知識項目と問題が収められている反面、計算過程や知識背景が大きく省略されているため、知識体系をきちんと学ぶ参考書として東京大学から出版されている名著「統計学入門」を使っています。
※ワークブックとしては素晴らしい質だと思いますが、どうしてもその内容量とページ数の都合上、問題のない範囲で削除されているということです。人によっては1冊で問題ない方もおられると思いますが、私には無理でした。
0.前提知識の定義
x, y \hspace{5mm} :変数
X, Y \hspace{2.9mm} :確率変数
p(x) \hspace{4mm} :Xの確率関数
f(x) \hspace{3.6mm} :Xの確率密度関数
p(x, y) \hspace{0.4mm} :XとYの同時確率関数
f(x, y) \hspace{0mm} :XとYの同時確率密度関数
E[X] \hspace{2.1mm} :Xの期待値
V[X] \hspace{2mm} :Xの分散
1.同時分布の特性値
1.1.相関
XとYともに平均よりも大きい(小さい)値をとりやすいとき、XとYは正の相関があるという。逆に、XとYの片方が平均より大きく、もう一方が平均よりも小さい値をとりやすいとき、XとYは負の相関があるという。相関を表す指標として、共分散や相関係数がある。
1.2.共分散
XとYの共分散(covariance)を以下のように定義し、Cov[X, Y]と書く。
Cov[X, Y] = E[(X - E[X])(Y - E[Y])]
なお、この式は次のように変形できる。
\begin{alignat*}{2}
Cov[X, Y] &= E[(X - E[X])(Y - E[Y])] \\
&= E[(XY - X \times E[Y] - Y \times E[X] + E[X]E[Y])] \\
&= E[XY] - E[X \times E[Y]] - E[Y \times E[X]] + E[E[X]E[Y]] \\
& \hspace{5mm} (E[X], E[Y]は定数であることに注意) \\
&= E[XY] - E[X]E[Y] - E[Y]E[X] + E[X]E[Y] \\
&= E[XY] - E[X]E[Y] \\
\end{alignat*}
1.3.相関係数
XとYの相関係数(correlation coefficient)を以下のように定義し、\rho [X, Y]と書く。
\begin{alignat*}{2}
\rho [X, Y] &= E \left[ \left( \cfrac{X - E[X]}{\sqrt{V[X]}} \right)
\left( \cfrac{Y - E[Y]}{\sqrt{V[Y]}} \right)
\right] \\
&= \cfrac{Cov[X, Y]}{\sqrt{V[X] V[Y]}} \\
&= \cfrac{E[XY] - E[X] E[Y]}{\sqrt{V[X] V[Y]}}
\end{alignat*}
\rho [X, Y]の値の範囲は-1 \leqq \rho[X, Y] \leqq 1であり、1, -1に近いほど相関の程度が強くなる。
1.4.条件付き期待値
1.4.1.確率変数が離散型のとき
Y = y_jが与えられたときのXの条件付き期待値(conditional expectation)を以下のように定義し、E[X|Y=y_j](またはE[X|Y])と書く。
\begin{alignat*}{2}
E[X|Y=y_j] &= \sum_{i = 1}^{\infty} x_i \times p_{X|Y} (x_i|y_j) \\
&= \sum_{i = 1}^{\infty} x_i \cfrac{p(x_i, y_j)}{p_Y (y_j)} \\
&= \sum_{i = 1}^{\infty} x_i
\cfrac{p(x_i, y_j)}
{\displaystyle \sum_{i = 1}^{\infty} p(x_i, y_j)} \\
\end{alignat*}
同様にX = x_iが与えられたときのYの条件付き期待値を以下のように定義し、E[Y|X=x_i](またはE[Y|X])と書く。
\begin{alignat*}{2}
E[Y|X=x_i] &= \sum_{j = 1}^{\infty} y_j \times p_{Y|X} (y_j|x_i) \\
&= \sum_{j = 1}^{\infty} y_j \cfrac{p(x_i, y_j)}{p_X (x_i)} \\
&= \sum_{j = 1}^{\infty} y_j
\cfrac{p(x_i, y_j)}
{\displaystyle \sum_{j = 1}^{\infty} p(x_i, y_j)} \\
\end{alignat*}
1.4.2.確率変数が連続型のとき
Y = yが与えられたときのXの条件付き期待値(conditional expectation)を以下のように定義し、E[X|Y=y](またはE[X|Y])と書く。
\begin{alignat*}{2}
E[X|Y=y] &= \int_{- \infty}^{\infty} x f_{X|Y} (x) dx \\
&= \int_{- \infty}^{\infty} x \cfrac{f(x, y)}{f_Y (y)} dx \\
&= \int_{- \infty}^{\infty} x
\cfrac{f(x, y)}
{\displaystyle \int_{- \infty}^{\infty} f (x, y) dx} dx \\
\end{alignat*}
同様にX = xが与えられたときのYの条件付き期待値を以下のように定義し、E[Y|X=x](またはE[Y|X])と書く。
\begin{alignat*}{2}
E[Y|X=x] &= \int_{- \infty}^{\infty} y f_{Y|X} (y) dy \\
&= \int_{- \infty}^{\infty} y \cfrac{f(x, y)}{f_X (x)} dy \\
&= \int_{- \infty}^{\infty} y
\cfrac{f(x, y)}
{\displaystyle \int_{- \infty}^{\infty} f (x, y) dy} dy \\
\end{alignat*}
1.5.条件付き分散
1.5.1.確率変数が離散型のとき
Y = y_jが与えられたときのXの条件付き分散(conditional variance)を以下のように定義し、V[X|Y=y_j]と書く。
\begin{alignat*}{2}
V[X|Y=y_j] &= V[X^2|Y=y_j] - (E[X|Y=y_j])^2 \\
&= \sum_{i = 1}^{\infty} (x_i - E[X|Y=y_j])^2 \times p_{X|Y} (x_i|y_j) \\
\end{alignat*}
同様にX = x_iが与えられたときのYの条件付き分散を以下のように定義し、V[Y|X=x_i]と書く。
\begin{alignat*}{2}
V[Y|X=x_i] &= V[Y^2|X=x_i] - (E[Y|X=x_i])^2 \\
&= \sum_{j = 1}^{\infty} (y_j - E[Y|X=x_i])^2 \times p_{Y|X} (y_j|x_i) \\
\end{alignat*}
1.5.2.確率変数が連続型のとき
Y = yが与えられたときのXの条件付き分散(conditional variance)を以下のように定義し、V[X|Y=y]と書く。
\begin{alignat*}{2}
V[X|Y=y] &= E[X^2|Y=y] - (E[X|Y=y])^2 \\
&= \int_{- \infty}^{\infty}
(x - E[X|Y=y])^2 \times f_{X|Y} (x) dx
\end{alignat*}
同様にX = xが与えられたときのYの条件付き分散を以下のように定義し、V[Y|X=x]と書く。
\begin{alignat*}{2}
V[Y|X=x] &= E[Y^2|X=x] - (E[Y|X=x])^2 \\
&= \int_{- \infty}^{\infty}
(y - E[Y|X=x])^2 \times f_{Y|X} (y) dy
\end{alignat*}
例題
面白そうな問題を探し中(」・ω・)」
解答
例題待ち中(´•ω•`)
参考資料
\bf{\textcolor{red}{記事が役に立った方は「いいね」を押していただけると、すごく喜びます \ 笑}}
ご協力のほどよろしくお願いします☆
Discussion