📊

【統計検定準1級】同時確率関数と同時確率密度関数

2024/07/04に公開

 はじめにこの記事では、統計検定準1級取得に向けて学習したことをまとめていきます。

工学系の数学ではなく数理あるあるの、論述ゴリゴリな解答になっていると思いますのであらかじめご了承ください。

注意：さらに計算過程は数学文化の『省略の美』を無視してエレファントに書いています。
【リンク紹介】

・統計検定準1級のまとめ記事一覧

・これまで書いたシリーズ記事一覧

 学習書籍についてこの記事では「統計学実践ワークブック」を中心に、学んだことをまとめていきます。記事を読んで本格的に勉強してみたいなと思った方は、是非ご購入を検討なさってください。



 参考書籍について統計実践ワークブックは、大量の知識項目と問題が収められている反面、計算過程や知識背景が大きく省略されているため、知識体系をきちんと学ぶ参考書として東京大学から出版されている名著「統計学入門」を使っています。

※ワークブックとしては素晴らしい質だと思いますが、どうしてもその内容量とページ数の都合上、問題のない範囲で削除されているということです。人によっては1冊で問題ない方もおられると思いますが、私には無理でした。



 1.基本知識
 1.1.変数x_i (i = 0, 1, 2, \cdots), y_j (j = 0, 1, 2, \cdots)を変数(variable)という。x, y, z \cdotsを用いることもある。

 1.2.確率変数確率をともなう変数のことを確率変数(random variable)といい、X, Y, \cdotsで表す。確率変数が取る値は、変数を用いて表される。

例：X = x, X = x_i (i = 0, 1, 2, \cdots)など

 1.2.1.離散型の確率変数確率変数Xが加算集合(例えば{x_1, x_2, \cdots}など)の中の値をとるとき、Xは離散型(discrete type)であるという。

このとき、確率変数を離散型確率変数(discrete random variable)ともいう。

 1.2.2.連続型の確率変数確率変数Xが非加算集合(例えば{x|a \leqq x \leqq b, a, b \in \bold{R}}など)の中の値をとるとき、Xは連続型(continuous type)であるという。

このとき、確率変数を連続型確率変数(continuous random variable)ともいう。

 1.3.確率関数確率変数Xが離散型であるとき、

P(X = x_i) = p(x_i) \ \ \ (i = 1, 2, \cdots)
を満たすpを、Xの確率関数(probability function)または確率分布(probability distribution)という。なお、pは次の2つの条件を満たす。

\begin{alignat*}{2}
p(x_i) \geqq 0                   & (i = 1, 2, \cdots) \\
\sum_{i = 1}^{\infty} p(x_i) = 1 & 
\end{alignat*}

 1.4.確率密度関数確率変数Xが連続型であるとき

P(a \leqq X \leqq b) = \int_{a}^{b} f(x) dx
を満たすfを、Xの確率密度関数(probability density function)という。ただし、書籍によっては「Xは連続型の確率分布をもつ」と定義しているものもある。なお、fは次の2つの条件を満たす。

すべてのxに対して、 f(x) \geqq 0

\int_{- \infty}^{\infty} f(x) dx = 1

 1.5.累積分布関数確率変数Xが離散型であるとき、

Xがx以下になるときの累積分布関数(cumulative distribution function)を以下のように定義し、F(x)（またはF_{X}(x)）と書く。

\begin{alignat*}{2}
F(x) &= P(X \leqq x) \\
     &= \sum_{x_i \leqq x} p(x_i) \ \ \ (i = 1, 2, \cdots) \\
     &= p(x_1) + p(x_2) + \cdots + p(x)
\end{alignat*}
確率変数Xが連続型であるとき、

Xがx以下になるときの累積分布関数を以下のように定義し、F(x)（またはF_{X}(x)）と書く。

\begin{alignat*}{2}
F(x) &= P(X \leqq x) \\
     &= \int_{- \infty}^{x} f(t) dt
\end{alignat*}
!【統計学特有の「従う」の定義】

数学科の人あるあるだと思うのですが、学部時代に「定義→定理→証明→定義→…」の無限ループを繰り返しているうちに、「定義が気になる病（私が今思いついた言い方）」に罹る人は少なくないと思います。その中で統計学特有の「正規分布に従う」のような「従う」という言葉をよく見かけるのですが…、はっきりと定義を明文化してるものがほとんどないのです。なんとなく意味の雰囲気はやってるうちにつかむものの、どうもモヤモヤしてしょうがない…。

そんな中、とうとう見つけました！東京大学出版の名著統計学入門(基礎統計学Ⅰ)にて、以下のように書かれていました。

確率変数Xが確率分布f(x)をもつとき、Xはf(x)に従うという。
なるほど、従うということは確率分布を持つことだったのですね。いや、めちゃくちゃ特別なことを述べているわけではありませんが、これまで長らくはっきりできていなかった定義が明らかになる瞬間は、とても気持ちの良いものでした。これを読んでいる誰かが同じ気持ちになってくれたら嬉しいです。※勉強不足だという指摘はおっしゃる通りでございます。

 2.同時確率関数確率変数X, Yが離散型であるとき、

P(X = x_i, Y = y_j) = p(x_i, y_j) \ \ \ (i = 1, 2, \cdots, j = 1, 2, \cdots)
を満たすpを同時確率関数(joint probability function)という。

※ワークブックでは、同時確率関数も同時確率密度関数も等しくf(x, y)で表記している。

なお、pは次の2つの条件を満たす。

\begin{alignat*}{2}
p(x_i, y_j) \geqq 0                   & \ \ \ (i = 1, 2, \cdots, j = 1, 2, \cdots) \\
\hspace{15mm}
\sum_{i = 1}^{\infty}
\sum_{j = 1}^{\infty} p(x_i, y_j) = 1 & 
\end{alignat*}

 2.1.期待値確率変数X, Yが離散型であるとき、

X, Yの関数g(X, Y)の期待値（または平均）を以下のように定義する。

E[g(X, Y)] = \sum_{i = 1}^{\infty} \sum_{j = 1}^{\infty}
             g(x_i, y_j) p(x_i, y_j)

 2.2.周辺確率関数確率変数X, Yが離散型であるとき、

\begin{alignat*}{2}
p_X (x_i) &= P(X = x_i) \\
          &= \sum_{j = 1}^{\infty} p(x_i, y_j) \\
          &(= g(x) ←ワークブックの表記)
\end{alignat*}
を、Xの周辺確率関数(marginal probability function)という。同様にして

\begin{alignat*}{2}
p_Y (y_j) &= P(Y = y_j) \\
          &= \sum_{i = 1}^{\infty} p(x_i, y_j) \\
          &(= h(y) ←ワークブックの表記)
\end{alignat*}
を、Yの周辺確率関数という。

 2.3.確率変数の独立性確率変数X, Yが離散型であるとき、XとYが独立であるとは、以下の等式が成り立つことである。

p(x_i, y_j) = p_X (x_i) \times p_Y (y_j) \ \ \ (i = 1, 2, \cdots, j = 1, 2, \cdots)

 2.4.条件付き確率関数確率変数X, Yが離散型であるとき、X = x_iが与えられたときにY = y_jとなる条件付き確率を

p_{Y|X} (y_j | x_i) = \cfrac{p(x_i, y_j)}{p_X (x_i)}
と定め、p_{Y|X} (y_j | x_i)を条件付き確率関数(conditional probability function)という。

 2.5.条件付き期待値確率変数X, Yが離散型であるとき、X = x_iが与えられたときのYとなる条件付き期待値(conditional expectation of Y given X = x_i)を次のように定める。

\begin{alignat*}{2}
E[Y|X] &= E[Y|X=x_i] \\
       &= \sum_{j = 1}^{\infty} y_j p_{Y|X} (y_j | x_i) \\
       &= \sum_{j = 1}^{\infty} y_j \cfrac{p(x_i, y_j)}{p_X (x_i)}
\end{alignat*}

 3.同時確率密度関数確率変数X, Yが連続型であるとき、

P(a \leqq X \leqq b, c \leqq Y \leqq d) = \int_{a}^{b} \int_{c}^{d} f(x, y) dx dy
を満たすfを同時確率密度関数(probability density function)という。なお、fは次の2つの条件を満たす。

すべてのx, yに対して、 f(x, y) \geqq 0

\int \int_{S} f(x) dx = 1
ただし、Sは標本空間(sample space)であるとする。

 3.1.期待値確率変数X, Yが連続型であるとき、

X, Yの関数g(X, Y)の期待値（または平均）を以下のように定義する。

E[g(X, Y)] = \int_{- \infty}^{ \infty}
             \int_{- \infty}^{ \infty}
             g(x, y) f(x, y) dx dy

 3.2.周辺確率密度関数確率変数X, Yが連続型であるとき、

\begin{alignat*}{2}
f_X (x) &= \int_{- \infty}^{\infty} f(x, y) dy \\
        &(= g(x) ←ワークブックの表記)
\end{alignat*}
を、Xの周辺確率密度関数(marginal probability density function)という。同様にして

\begin{alignat*}{2}
f_Y (y) &= \int_{- \infty}^{\infty} f(x, y) dx \\
        &(= h(x) ←ワークブックの表記)
\end{alignat*}
を、Yの周辺確率密度関数という。

 3.3.確率変数の独立性確率変数X, Yが連続型であるとき、XとYが独立であるとは、以下の等式が成り立つことである。

f(x, y) = f_X (x) \times f_Y (y)

 3.4.条件付き確率密度関数確率変数X, Yが連続型であるとき、X = xが与えられたときにY = yとなる条件付き確率を

f_{Y|X} (y|x) = \cfrac{f(x, y)}{f_X (x)}
と定め、f_{Y|X} (y|x)を条件付き確率密度関数(conditional probability density function)という。

 3.5.条件付き期待値確率変数X, Yが連続型であるとき、X = xが与えられたときのYとなる条件付き期待値(conditional expectation of Y given X = x)を次のように定める。

\begin{alignat*}{2}
E[Y|X] &= E[Y|X=x_i] \\
       &= \int_{- \infty}^{\infty} y f_{Y|X} (y|x) dy \\
       &= \int_{- \infty}^{\infty} y \cfrac{f(x, y)}{f_X (x)} dy
\end{alignat*}

 例題(「統計学実践ワークブック」より)

問2.1

xy-平面の単位正方形{(x, y) | 0 \leqq x \leqq 1, 0 \leqq y \leqq 1}上の確率密度関数f(x, y)を

f(x, y) = c(x + y)
とおく。

[1] 基準化定数cを求めよ。

　　※基準化定数とは全積分が1となる定数のこと。

[2] Xの周辺確率密度関数を求めよ。

[3] Xを与えたときのYの条件付き確率密度関数を求めよ。

 解答[1] 基準化定数cを求めよ。
題意より、

\int_{0}^{1} \int_{0}^{1} f(x, y) dx dy = 1
を満たすcを求めればよい。よって、

\begin{alignat*}{2}
(左辺) &= \int_{0}^{1} \int_{0}^{1} f(x, y) dx dy \\
       &= \int_{0}^{1} \int_{0}^{1} c(x + y) dx dy \\
       &= c \int_{0}^{1} \int_{0}^{1} (x + y) dx dy \\
       &= c \int_{0}^{1} \left[ \cfrac{1}{2} x^2 + yx \right]_{0}^{1} dy \\
       &= c \int_{0}^{1} \left( \cfrac{1}{2} + y \right) dy \\
       &= c \left[ \cfrac{1}{2} y + \cfrac{1}{2} y^2 \right]_{0}^{1} \\
       &= c \left( \cfrac{1}{2} + \cfrac{1}{2} \right) \\
       &= c
\end{alignat*}
したがって、\underline{c = 1}
[2] Xの周辺確率密度関数を求めよ。
[1]より、f(x, y) = x + yである。よって、

\begin{alignat*}{2}
f_X (x) &= \int_{0}^{1} f(x, y) dy \\
        &= \int_{0}^{1} (x + y) dy \\
        &= \left[ xy + \cfrac{1}{2} y^2 \right]_{0}^{1} \\
        &= \underline{x + \cfrac{1}{2}}
\end{alignat*}
[3] Xを与えたときのYの条件付き確率密度関数を求めよ。

\begin{alignat*}{2}
f_{Y|X} (y|x) &= \cfrac{f(x, y)}{f_X (x)} \\
              &= \cfrac{ \hspace{3mm} x + y \hspace{3mm} }{x + \cfrac{1}{2}} \\
              &= \underline{\cfrac{2(x + y)}{2x + 1}}
\end{alignat*}

 参考資料日本統計学会(編集).日本統計学会認定 統計検定準１級対応 統計学実践ワークブック.学術図書出版社.2020
東京大学教養学部統計学教室.統計学入門(基礎統計学Ⅰ).東京大学出版会.1991
小寺 平治.新統計入門.裳華房.1996
稲垣 宣生, 山根 芳知, 吉田 光雄.統計学入門.裳華房.1992
長瀬道弘・芦野隆一.微分積分概説.サイエンス社.2007
加藤文元.チャート式シリーズ 大学教養 微分積分.数研出版.2024
\bf{\textcolor{red}{記事が役に立った方は「いいね」を押していただけると、すごく喜びます \ 笑}}

ご協力のほどよろしくお願いします。

はじめに

学習書籍について

参考書籍について

1.基本知識

1.1.変数

1.2.確率変数

1.2.1.離散型の確率変数

1.2.2.連続型の確率変数

1.3.確率関数

1.4.確率密度関数

1.5.累積分布関数

2.同時確率関数

2.1.期待値

2.2.周辺確率関数

2.3.確率変数の独立性

2.4.条件付き確率関数

2.5.条件付き期待値

3.同時確率密度関数

3.1.期待値

3.2.周辺確率密度関数

3.3.確率変数の独立性

3.4.条件付き確率密度関数

3.5.条件付き期待値

例題

解答

参考資料

Discussion