はじめに
この記事では、統計検定準1級取得に向けて学習したことをまとめていきます。
工学系の数学ではなく数理あるあるの、論述ゴリゴリな解答になっていると思いますのであらかじめご了承ください。
注意:さらに計算過程は数学文化の『省略の美』を無視してエレファントに書いています。
【リンク紹介】
・統計検定準1級のまとめ記事一覧
・これまで書いたシリーズ記事一覧
学習書籍について
この記事では「統計学実践ワークブック」を中心に、学んだことをまとめていきます。記事を読んで本格的に勉強してみたいなと思った方は、是非ご購入を検討なさってください。
参考書籍について
統計実践ワークブックは、大量の知識項目と問題が収められている反面、計算過程や知識背景が大きく省略されているため、知識体系をきちんと学ぶ参考書として東京大学から出版されている名著「統計学入門」を使っています。
※ワークブックとしては素晴らしい質だと思いますが、どうしてもその内容量とページ数の都合上、問題のない範囲で削除されているということです。人によっては1冊で問題ない方もおられると思いますが、私には無理でした。
1.基本知識
1.1.変数
x_i (i = 0, 1, 2, \cdots), y_j (j = 0, 1, 2, \cdots)を変数(variable)という。x, y, z \cdotsを用いることもある。
1.2.確率変数
確率をともなう変数のことを確率変数(random variable)といい、X, Y, \cdotsで表す。確率変数が取る値は、変数を用いて表される。
例:X = x, X = x_i (i = 0, 1, 2, \cdots)など
1.2.1.離散型の確率変数
確率変数Xが加算集合(例えば{x_1, x_2, \cdots}など)の中の値をとるとき、Xは離散型(discrete type)であるという。
このとき、確率変数を離散型確率変数(discrete random variable)ともいう。
1.2.2.連続型の確率変数
確率変数Xが非加算集合(例えば{x|a \leqq x \leqq b, a, b \in \bold{R}}など)の中の値をとるとき、Xは連続型(continuous type)であるという。
このとき、確率変数を連続型確率変数(continuous random variable)ともいう。
1.3.確率関数
確率変数Xが離散型であるとき、
P(X = x_i) = p(x_i) \ \ \ (i = 1, 2, \cdots)
を満たすpを、Xの確率関数(probability function)または確率分布(probability distribution)という。なお、pは次の2つの条件を満たす。
\begin{alignat*}{2}
p(x_i) \geqq 0 & (i = 1, 2, \cdots) \\
\sum_{i = 1}^{\infty} p(x_i) = 1 &
\end{alignat*}
1.4.確率密度関数
確率変数Xが連続型であるとき
P(a \leqq X \leqq b) = \int_{a}^{b} f(x) dx
を満たすfを、Xの確率密度関数(probability density function)という。ただし、書籍によっては「Xは連続型の確率分布をもつ」と定義しているものもある。なお、fは次の2つの条件を満たす。
\int_{- \infty}^{\infty} f(x) dx = 1
1.5.累積分布関数
確率変数Xが離散型であるとき、
Xがx以下になるときの累積分布関数(cumulative distribution function)を以下のように定義し、F(x)(またはF_{X}(x))と書く。
\begin{alignat*}{2}
F(x) &= P(X \leqq x) \\
&= \sum_{x_i \leqq x} p(x_i) \ \ \ (i = 1, 2, \cdots) \\
&= p(x_1) + p(x_2) + \cdots + p(x)
\end{alignat*}
確率変数Xが連続型であるとき、
Xがx以下になるときの累積分布関数を以下のように定義し、F(x)(またはF_{X}(x))と書く。
\begin{alignat*}{2}
F(x) &= P(X \leqq x) \\
&= \int_{- \infty}^{x} f(x) dx
\end{alignat*}
2.同時確率関数
確率変数X, Yが離散型であるとき、
P(X = x_i, Y = y_j) = p(x_i, y_j) \ \ \ (i = 1, 2, \cdots, j = 1, 2, \cdots)
を満たすpを同時確率関数(joint probability function)という。
※ワークブックでは、同時確率関数も同時確率密度関数も等しくf(x, y)で表記している。
なお、pは次の2つの条件を満たす。
\begin{alignat*}{2}
p(x_i, y_j) \geqq 0 & \ \ \ (i = 1, 2, \cdots, j = 1, 2, \cdots) \\
\hspace{15mm}
\sum_{i = 1}^{\infty}
\sum_{j = 1}^{\infty} p(x_i, y_j) = 1 &
\end{alignat*}
2.1.期待値
確率変数X, Yが離散型であるとき、
X, Yの関数g(X, Y)の期待値(または平均)を以下のように定義する。
E[g(X, Y)] = \sum_{i = 1}^{\infty} \sum_{j = 1}^{\infty}
g(x_i, y_j) p(x_i, y_j)
2.2.周辺確率関数
確率変数X, Yが離散型であるとき、
\begin{alignat*}{2}
p_X (x_i) &= P(X = x_i) \\
&= \sum_{j = 1}^{\infty} p(x_i, y_j) \\
&(= g(x) ←ワークブックの表記)
\end{alignat*}
を、Xの周辺確率関数(marginal probability function)という。同様にして
\begin{alignat*}{2}
p_Y (y_j) &= P(Y = y_j) \\
&= \sum_{i = 1}^{\infty} p(x_i, y_j) \\
&(= h(y) ←ワークブックの表記)
\end{alignat*}
を、Yの周辺確率関数という。
2.3.確率変数の独立性
確率変数X, Yが離散型であるとき、XとYが独立であるとは、以下の等式が成り立つことである。
p(x_i, y_j) = p_X (x_i) \times p_Y (y_j) \ \ \ (i = 1, 2, \cdots, j = 1, 2, \cdots)
2.4.条件付き確率関数
確率変数X, Yが離散型であるとき、X = x_iが与えられたときにY = y_jとなる条件付き確率を
p_{Y|X} (y_j | x_i) = \cfrac{p(x_i, y_j)}{p_X (x_i)}
と定め、p_{Y|X} (y_j | x_i)を条件付き確率関数(conditional probability function)という。
2.5.条件付き期待値
確率変数X, Yが離散型であるとき、X = x_iが与えられたときのYとなる条件付き期待値(conditional expectation of Y given X = x_i)を次のように定める。
\begin{alignat*}{2}
E[Y|X] &= E[Y|X=x_i] \\
&= \sum_{j = 1}^{\infty} y_j p_{Y|X} (y_j | x_i) \\
&= \sum_{j = 1}^{\infty} y_j \cfrac{p(x_i, y_j)}{p_X (x_i)}
\end{alignat*}
3.同時確率密度関数
確率変数X, Yが連続型であるとき、
P(a \leqq X \leqq b, c \leqq Y \leqq d) = \int_{a}^{b} \int_{c}^{d} f(x, y) dx dy
を満たすfを同時確率密度関数(probability density function)という。なお、fは次の2つの条件を満たす。
すべてのx, yに対して、 f(x, y) \geqq 0
\int \int_{S} f(x) dx = 1
ただし、Sは標本空間(sample space)であるとする。
3.1.期待値
確率変数X, Yが連続型であるとき、
X, Yの関数g(X, Y)の期待値(または平均)を以下のように定義する。
E[g(X, Y)] = \int_{- \infty}^{ \infty}
\int_{- \infty}^{ \infty}
g(x, y) f(x, y) dx dy
3.2.周辺確率密度関数
確率変数X, Yが連続型であるとき、
\begin{alignat*}{2}
f_X (x) &= \int_{- \infty}^{\infty} f(x, y) dy \\
&(= g(x) ←ワークブックの表記)
\end{alignat*}
を、Xの周辺確率密度関数(marginal probability density function)という。同様にして
\begin{alignat*}{2}
f_Y (y) &= \int_{- \infty}^{\infty} f(x, y) dx \\
&(= h(x) ←ワークブックの表記)
\end{alignat*}
を、Yの周辺確率密度関数という。
3.3.確率変数の独立性
確率変数X, Yが連続型であるとき、XとYが独立であるとは、以下の等式が成り立つことである。
f(x, y) = f_X (x) \times f_Y (y)
3.4.条件付き確率密度関数
確率変数X, Yが連続型であるとき、X = xが与えられたときにY = yとなる条件付き確率を
f_{Y|X} (y|x) = \cfrac{f(x, y)}{f_X (x)}
と定め、f_{Y|X} (y|x)を条件付き確率密度関数(conditional probability density function)という。
3.5.条件付き期待値
確率変数X, Yが連続型であるとき、X = xが与えられたときのYとなる条件付き期待値(conditional expectation of Y given X = x)を次のように定める。
\begin{alignat*}{2}
E[Y|X] &= E[Y|X=x_i] \\
&= \int_{- \infty}^{\infty} y f_{Y|X} (y|x) dy \\
&= \int_{- \infty}^{\infty} y \cfrac{f(x, y)}{f_X (x)} dy
\end{alignat*}
例題
(「統計学実践ワークブック」より)
問2.1
xy-平面の単位正方形{(x, y) | 0 \leqq x \leqq 1, 0 \leqq y \leqq 1}上の確率密度関数f(x, y)を
とおく。
[1] 基準化定数cを求めよ。
※基準化定数とは全積分が1となる定数のこと。
[2] Xの周辺確率密度関数を求めよ。
[3] Xを与えたときのYの条件付き確率密度関数を求めよ。
解答
[1] 基準化定数cを求めよ。
題意より、
\int_{0}^{1} \int_{0}^{1} f(x, y) dx dy = 1
を満たすcを求めればよい。よって、
\begin{alignat*}{2}
(左辺) &= \int_{0}^{1} \int_{0}^{1} f(x, y) dx dy \\
&= \int_{0}^{1} \int_{0}^{1} c(x + y) dx dy \\
&= c \int_{0}^{1} \int_{0}^{1} (x + y) dx dy \\
&= c \int_{0}^{1} \left[ \cfrac{1}{2} x^2 + yx \right]_{0}^{1} dy \\
&= c \int_{0}^{1} \left( \cfrac{1}{2} + y \right) dy \\
&= c \left[ \cfrac{1}{2} y + \cfrac{1}{2} y^2 \right]_{0}^{1} \\
&= c \left( \cfrac{1}{2} + \cfrac{1}{2} \right) \\
&= c
\end{alignat*}
したがって、\underline{c = 1}
[2] Xの周辺確率密度関数を求めよ。
[1]より、f(x, y) = x + yである。よって、
\begin{alignat*}{2}
f_X (x) &= \int_{0}^{1} f(x, y) dy \\
&= \int_{0}^{1} (x + y) dy \\
&= \left[ xy + \cfrac{1}{2} y^2 \right]_{0}^{1} \\
&= \underline{x + \cfrac{1}{2}}
\end{alignat*}
[3] Xを与えたときのYの条件付き確率密度関数を求めよ。
\begin{alignat*}{2}
f_{Y|X} (y|x) &= \cfrac{f(x, y)}{f_X (x)} \\
&= \cfrac{ \hspace{3mm} x + y \hspace{3mm} }{x + \cfrac{1}{2}} \\
&= \underline{\cfrac{2(x + y)}{2x + 1}}
\end{alignat*}
参考資料
\bf{\textcolor{red}{記事が役に立った方は「いいね」を押していただけると、すごく喜びます \ 笑}}
ご協力のほどよろしくお願いします。
Discussion