はじめに
この記事では、統計検定準1級取得に向けて学習したことをまとめていきます。
工学系の数学ではなく数理あるあるの、論述ゴリゴリな解答になっていると思いますのであらかじめご了承ください。
注意:さらに計算過程は数学文化の『省略の美』を無視してエレファントに書いています。
【リンク紹介】
・統計検定準1級のまとめ記事一覧
・これまで書いたシリーズ記事一覧
学習書籍について
この記事では「統計学実践ワークブック」を中心に、学んだことをまとめていきます。記事を読んで本格的に勉強してみたいなと思った方は、是非ご購入を検討なさってください。
参考書籍について
統計実践ワークブックは、大量の知識項目と問題が収められている反面、計算過程や知識背景が大きく省略されているため、知識体系をきちんと学ぶ参考書として東京大学から出版されている名著「統計学入門」を使っています。
※ワークブックとしては素晴らしい質だと思いますが、どうしてもその内容量とページ数の都合上、問題のない範囲で削除されているということです。人によっては1冊で問題ない方もおられると思いますが、私には無理でした。
前提知識
前提知識の定義
x, y \hspace{5mm} :変数
X, Y \hspace{2.9mm} :確率変数
f(x) \hspace{3.6mm} :Xの確率密度関数
f(x, y) \hspace{0mm} :XとYの同時確率密度関数
E[X] \hspace{2.1mm} :Xの期待値
V[X] \hspace{2mm} :Xの分散
m(\theta) \hspace{3.5mm}:モーメント母関数
確率密度関数の変数変換
連続型の確率変数Xの確率密度関数をf(x)とする。そして確率変数YをY = g(X)とする。ただし、g(x)は1対1の関数(単調増加(減少)関数)とする。このとき、Yの確率密度関数は次の式で表される。
f(g^{-1} (y)) \cdot \cfrac{1}{| g^\prime (g^{-1} (y)) |}
※ここでの記号||は、絶対値記号である。
導出
f(x)はXの確率密度関数であるから、Xの取りうる値をa \leqq X \leqq bとすると、定義より
P(a \leqq X \leqq b) = \int_{a}^{b} f(x) dx
が成り立つ。ここでy = g(x)とすると、a \leqq x \leqq bに対して
g(a) \leqq y \leqq g(b) \ \cdots ①
であり、またgは1対1の関数であるため逆関数を持つ。つまり
x = g^{-1} (y) \ \cdots ②
が成り立つ。さらに
\begin{alignat*}{2}
y &= g(x) \\
\cfrac{dy}{dx} &= g^\prime (x) \\
dx &= \cfrac{1}{g^\prime (x)} dy \ \cdots ③
\end{alignat*}
であり、以上①~③より
\begin{alignat*}{2}
P(a \leqq X \leqq b) &= \int_{a}^{b} f(x) dx \\
&= \int_{g(a)}^{g(b)} f(g^{-1} (y)) \cdot
\left| \cfrac{1}{g^\prime (x)} \right| dy \\
&= \int_{g(a)}^{g(b)} f(g^{-1} (y)) \cdot
\cfrac{1}{| g^\prime (f^{-1} (y)) |} dy \\
&= P(g(a) \leqq Y \leqq g(b))
\end{alignat*}
である。したがって、Yの確率密度関数は、
f(g^{-1} (y)) \cdot \cfrac{1}{| g^\prime (g^{-1} (y)) |}
である。
例題
(「統計学実践ワークブック」より)
問4.1
確率変数Xは正規分布N(\mu, \sigma^2)に従い、その確率密度関数はf(x) = \cfrac{1}{\sqrt{2 \pi} \sigma} e^{- \frac{(x - \mu)^2}{2 \sigma^2}}であるとする。このとき、確率変数YをY = e^Xとする。
[1] Yの期待値を求めよ。
[2] Yの分散を求めよ。
[3] Yの確率密度関数を求めよ。
解答
[1] Yの期待値を求めよ。
E[Y]つまりE[e^X]の値を求める。
Xのモーメント母関数は、Xが連続型であることから
定義より、
\begin{alignat*}{2}
m(\theta) &= E[e^{\theta X}] \\
&= \int_{- \infty}^{\infty} e^{\theta x} f(x) dx
\end{alignat*}
である。ここで、Xは正規分布に従うことから、確率密度関数f(x)は
f(x) = \cfrac{1}{\sqrt{2 \pi} \sigma} e^{- \frac{(x - \mu)^2}{2 \sigma^2}}
である。よって、
\begin{alignat*}{2}
m(\theta) &= E[e^{\theta X}] \\
&= \int_{- \infty}^{\infty} e^{\theta x} \cdot
\frac{1}{\sqrt{2 \pi} \sigma}
e^{- \frac{(x - \mu)^2}{2 \sigma^2}}dx \\
&= \int_{- \infty}^{\infty} \frac{1}{\sqrt{2 \pi} \sigma}
e^{\theta x - \frac{(x - \mu)^2}{2 \sigma^2}} dx
\end{alignat*}
である。ここで、
\begin{alignat*}{2}
\theta x - \cfrac{(x - \mu)^2}{2 \sigma^2}
&= \cfrac{2 \sigma^2 \theta x}{2 \sigma^2} - \cfrac{x^2 - 2 \mu x + \mu^2}{2 \sigma} \\
&= - \cfrac{x^2 - 2(\sigma^2 \theta + \mu)x + \mu^2}{2 \sigma^2} \\
&= - \cfrac{\{ x^2 - 2(\sigma^2 \theta + \mu)x + (\sigma^2 \theta + \mu)^2 \}
- (\sigma^2 \theta + \mu)^2
+ \mu^2
}{2 \sigma^2} \\
&= - \cfrac{(x - (\sigma^2 \theta + \mu))^2
- \sigma^4 \theta^2
- 2 \sigma^2 \mu \theta
}{2 \sigma^2} \\
&= - \cfrac{(x - (\sigma^2 \theta + \mu))^2}{2 \sigma^2}
+ \cfrac{\sigma^4 \theta^2 + 2 \sigma^2 \theta}{2 \sigma^2} \\
&= - \cfrac{(x - (\sigma^2 \theta + \mu))^2}{2 \sigma^2}
+ \cfrac{\sigma^2 \theta^2}{2}
+ \mu \theta \\
\end{alignat*}
であるから、
\begin{alignat*}{2}
m(\theta) &= E[e^{\theta X}] \\
&= \int_{- \infty}^{\infty} e^{\theta x} \cdot
\frac{1}{\sqrt{2 \pi} \sigma}
e^{- \frac{(x - \mu)^2}{2 \sigma^2}}dx \\
&= \int_{- \infty}^{\infty} \frac{1}{\sqrt{2 \pi} \sigma}
e^{\theta x - \frac{(x - \mu)^2}{2 \sigma^2}} dx \\
&= \int_{- \infty}^{\infty} \frac{1}{\sqrt{2 \pi} \sigma}
e^{ \left(
- \frac{(x - (\sigma^2 \theta + \mu))^2}{2 \sigma^2}
+ \frac{\sigma^2 \theta^2}{2}
+ \mu \theta
\right)
} dx \\
&= e^{\frac{\sigma^2 \theta^2}{2} + \mu \theta}
\int_{- \infty}^{\infty} \frac{1}{\sqrt{2 \pi} \sigma}
e^{ - \frac{(x - (\sigma^2 \theta + \mu))^2}{2 \sigma^2} } dx \\
\end{alignat*}
となる。ここで、
\frac{1}{\sqrt{2 \pi} \sigma} e^{- \frac{(x - (\sigma^2 \theta + \mu))^2}{2 \sigma^2}}
について、これは平均が\sigma^2 \theta + \mu、分散が\sigma^2の正規分布の確率密度関数である。すると、この確率密度関数は次の性質を持つ。
\int_{- \infty}^{\infty} \frac{1}{\sqrt{2 \pi} \sigma}
e^{- \frac{(x - (\sigma^2 \theta + \mu))^2}
{2 \sigma^2}
} dx = 1
ゆえに、m(\theta)は
\begin{alignat*}{2}
m(\theta) &= E[e^{\theta X}] \\
&= e^{\frac{\sigma^2 \theta^2}{2} + \mu \theta}
\int_{- \infty}^{\infty} \frac{1}{\sqrt{2 \pi} \sigma}
e^{ - \frac{(x - (\sigma^2 \theta + \mu))^2}{2 \sigma^2} } dx \\
&= e^{\frac{\sigma^2 \theta^2}{2} + \mu \theta} \cdot 1\\
&= e^{\frac{\sigma^2 \theta^2}{2} + \mu \theta} \\
\end{alignat*}
である。したがって、\theta = 1とすると
\begin{alignat*}{2}
m(1) &= E[e^{X}] \\
&= E[Y] \\
&= \underline{e^{\frac{\sigma^2}{2} + \mu}}
\end{alignat*}
[2] Yの分散を求めよ。
V[Y]の値を求める。分散の性質より
\begin{alignat*}{2}
V[Y] &= E[Y^2] - (E[Y])^2 \\
&= E[(e^X)^2] - (E[e^X])^2 \\
\end{alignat*}
であるので、つまりE[(e^X)^2] - (E[e^X])^2を求めればよい。
E[e^X]の値は[1]より求めているので、E[(e^X)^2]の値を求める。
これは、Xモーメント母関数
m(\theta) = E[e^{\theta X}]
において、\theta = 2と置けばよいのでE[e^{2 X}]の値は、
\begin{alignat*}{2}
E[e^{2 X}] = e^{2 \mu + 2 \sigma^2}
\end{alignat*}
である。したがって求めるYの分散は
\begin{alignat*}{2}
V[Y] &= E[(e^X)^2] - (E[e^X])^2 \\
&= e^{2 \mu + 2 \sigma^2} - \left( e^{\mu + \frac{\sigma^2}{2}} \right)^2 \\
&= e^{2 \mu + 2 \sigma^2} - e^{2\mu + \sigma^2} \\
&= e^{2 \mu + \sigma^2} \cdot e^{\sigma^2} - e^{2\mu + \sigma^2} \\
&= \underline{e^{2 \mu + \sigma^2} \left( e^{\sigma^2} - 1 \right)} \\
\end{alignat*}
[3] Yの確率密度関数を求めよ。
y = e^x \Leftrightarrow x = \log y
であり、また
\begin{alignat*}{2}
y &= e^x \\
\cfrac{dy}{dx} &= \left( e^x \right)^\prime \\
dx &= \cfrac{1}{e^x} dy \\
&= \cfrac{1}{e^{\log y}} dy \\
&= \cfrac{1}{y} dy \\
\end{alignat*}
であるので、Yの確率密度関数は
\begin{alignat*}{2}
\cfrac{1}{\sqrt{2 \pi} \sigma} \
e^{- \frac{( \log y - \mu )^2}{2 \sigma^2}}
\cdot \cfrac{1}{y}
&= \underline{
\cfrac{1}{\sqrt{2 \pi} \sigma y} \
e^{- \frac{( \log y - \mu )^2}{2 \sigma^2}}
}
\end{alignat*}
参考資料
\bf{\textcolor{red}{記事が役に立った方は「いいね」を押していただけると、すごく喜びます \ 笑}}
ご協力のほどよろしくお願いします。
Discussion