Zenn
📊

【統計検定準1級】確率密度関数の変数変換

に公開

はじめに

この記事では、統計検定準1級取得に向けて学習したことをまとめていきます。
工学系の数学ではなく数理あるあるの、論述ゴリゴリな解答になっていると思いますのであらかじめご了承ください。
注意:さらに計算過程は数学文化の『省略の美』を無視してエレファントに書いています。

【リンク紹介】
統計検定準1級のまとめ記事一覧
これまで書いたシリーズ記事一覧

学習書籍について

この記事では「統計学実践ワークブック」を中心に、学んだことをまとめていきます。記事を読んで本格的に勉強してみたいなと思った方は、是非ご購入を検討なさってください。


参考書籍について

統計実践ワークブックは、大量の知識項目と問題が収められている反面、計算過程や知識背景が大きく省略されているため、知識体系をきちんと学ぶ参考書として東京大学から出版されている名著「統計学入門」を使っています。
※ワークブックとしては素晴らしい質だと思いますが、どうしてもその内容量とページ数の都合上、問題のない範囲で削除されているということです。人によっては1冊で問題ない方もおられると思いますが、私には無理でした。


前提知識

前提知識の定義

x,yx, y \hspace{5mm}変数
X,YX, Y \hspace{2.9mm}確率変数
f(x)f(x) \hspace{3.6mm}XX確率密度関数
f(x,y)f(x, y) \hspace{0mm}XXYY同時確率密度関数
E[X]E[X] \hspace{2.1mm}XX期待値
V[X]V[X] \hspace{2mm}XX分散
m(θ)m(\theta) \hspace{3.5mm}モーメント母関数

確率密度関数の変数変換

連続型の確率変数XXの確率密度関数をf(x)f(x)とする。そして確率変数YYY=g(X)Y = g(X)とする。ただし、g(x)g(x)は1対1の関数(単調増加(減少)関数)とする。このとき、YYの確率密度関数は次の式で表される。

f(g1(y))1g(g1(y)) f(g^{-1} (y)) \cdot \cfrac{1}{| g^\prime (g^{-1} (y)) |}

※ここでの記号||は、絶対値記号である。

導出

f(x)f(x)XXの確率密度関数であるから、XXの取りうる値をaXba \leqq X \leqq bとすると、定義より

P(aXb)=abf(x)dx P(a \leqq X \leqq b) = \int_{a}^{b} f(x) dx

が成り立つ。ここでy=g(x)y = g(x)とすると、axba \leqq x \leqq bに対して

g(a)yg(b)  g(a) \leqq y \leqq g(b) \ \cdots ①

であり、またggは1対1の関数であるため逆関数を持つ。つまり

x=g1(y)  x = g^{-1} (y) \ \cdots ②

が成り立つ。さらに

y=g(x)dydx=g(x)dx=1g(x)dy  \begin{alignat*}{2} y &= g(x) \\ \cfrac{dy}{dx} &= g^\prime (x) \\ dx &= \cfrac{1}{g^\prime (x)} dy \ \cdots ③ \end{alignat*}

であり、以上①~③より

P(aXb)=abf(x)dx=g(a)g(b)f(g1(y))1g(x)dy=g(a)g(b)f(g1(y))1g(f1(y))dy=P(g(a)Yg(b)) \begin{alignat*}{2} P(a \leqq X \leqq b) &= \int_{a}^{b} f(x) dx \\ &= \int_{g(a)}^{g(b)} f(g^{-1} (y)) \cdot \left| \cfrac{1}{g^\prime (x)} \right| dy \\ &= \int_{g(a)}^{g(b)} f(g^{-1} (y)) \cdot \cfrac{1}{| g^\prime (f^{-1} (y)) |} dy \\ &= P(g(a) \leqq Y \leqq g(b)) \end{alignat*}

である。したがって、YYの確率密度関数は、

f(g1(y))1g(g1(y)) f(g^{-1} (y)) \cdot \cfrac{1}{| g^\prime (g^{-1} (y)) |}

である。

例題

(「統計学実践ワークブック」より)
問4.1
確率変数XXは正規分布N(μ,σ2)N(\mu, \sigma^2)に従い、その確率密度関数はf(x)=12πσe(xμ)22σ2f(x) = \cfrac{1}{\sqrt{2 \pi} \sigma} e^{- \frac{(x - \mu)^2}{2 \sigma^2}}であるとする。このとき、確率変数YYY=eXY = e^Xとする。

[1] YYの期待値を求めよ。
[2] YYの分散を求めよ。
[3] YYの確率密度関数を求めよ。

解答

[1] YYの期待値を求めよ。
E[Y]E[Y]つまりE[e^X]の値を求める。
XXのモーメント母関数は、XXが連続型であることから
定義より、

m(θ)=E[eθX]=eθxf(x)dx \begin{alignat*}{2} m(\theta) &= E[e^{\theta X}] \\ &= \int_{- \infty}^{\infty} e^{\theta x} f(x) dx \end{alignat*}

である。ここで、XX正規分布に従うことから、確率密度関数f(x)f(x)

f(x)=12πσe(xμ)22σ2 f(x) = \cfrac{1}{\sqrt{2 \pi} \sigma} e^{- \frac{(x - \mu)^2}{2 \sigma^2}}

である。よって、

m(θ)=E[eθX]=eθx12πσe(xμ)22σ2dx=12πσeθx(xμ)22σ2dx \begin{alignat*}{2} m(\theta) &= E[e^{\theta X}] \\ &= \int_{- \infty}^{\infty} e^{\theta x} \cdot \frac{1}{\sqrt{2 \pi} \sigma} e^{- \frac{(x - \mu)^2}{2 \sigma^2}}dx \\ &= \int_{- \infty}^{\infty} \frac{1}{\sqrt{2 \pi} \sigma} e^{\theta x - \frac{(x - \mu)^2}{2 \sigma^2}} dx \end{alignat*}

である。ここで、

θx(xμ)22σ2=2σ2θx2σ2x22μx+μ22σ=x22(σ2θ+μ)x+μ22σ2={x22(σ2θ+μ)x+(σ2θ+μ)2}(σ2θ+μ)2+μ22σ2=(x(σ2θ+μ))2σ4θ22σ2μθ2σ2=(x(σ2θ+μ))22σ2+σ4θ2+2σ2θ2σ2=(x(σ2θ+μ))22σ2+σ2θ22+μθ \begin{alignat*}{2} \theta x - \cfrac{(x - \mu)^2}{2 \sigma^2} &= \cfrac{2 \sigma^2 \theta x}{2 \sigma^2} - \cfrac{x^2 - 2 \mu x + \mu^2}{2 \sigma} \\ &= - \cfrac{x^2 - 2(\sigma^2 \theta + \mu)x + \mu^2}{2 \sigma^2} \\ &= - \cfrac{\{ x^2 - 2(\sigma^2 \theta + \mu)x + (\sigma^2 \theta + \mu)^2 \} - (\sigma^2 \theta + \mu)^2 + \mu^2 }{2 \sigma^2} \\ &= - \cfrac{(x - (\sigma^2 \theta + \mu))^2 - \sigma^4 \theta^2 - 2 \sigma^2 \mu \theta }{2 \sigma^2} \\ &= - \cfrac{(x - (\sigma^2 \theta + \mu))^2}{2 \sigma^2} + \cfrac{\sigma^4 \theta^2 + 2 \sigma^2 \theta}{2 \sigma^2} \\ &= - \cfrac{(x - (\sigma^2 \theta + \mu))^2}{2 \sigma^2} + \cfrac{\sigma^2 \theta^2}{2} + \mu \theta \\ \end{alignat*}

であるから、

m(θ)=E[eθX]=eθx12πσe(xμ)22σ2dx=12πσeθx(xμ)22σ2dx=12πσe((x(σ2θ+μ))22σ2+σ2θ22+μθ)dx=eσ2θ22+μθ12πσe(x(σ2θ+μ))22σ2dx \begin{alignat*}{2} m(\theta) &= E[e^{\theta X}] \\ &= \int_{- \infty}^{\infty} e^{\theta x} \cdot \frac{1}{\sqrt{2 \pi} \sigma} e^{- \frac{(x - \mu)^2}{2 \sigma^2}}dx \\ &= \int_{- \infty}^{\infty} \frac{1}{\sqrt{2 \pi} \sigma} e^{\theta x - \frac{(x - \mu)^2}{2 \sigma^2}} dx \\ &= \int_{- \infty}^{\infty} \frac{1}{\sqrt{2 \pi} \sigma} e^{ \left( - \frac{(x - (\sigma^2 \theta + \mu))^2}{2 \sigma^2} + \frac{\sigma^2 \theta^2}{2} + \mu \theta \right) } dx \\ &= e^{\frac{\sigma^2 \theta^2}{2} + \mu \theta} \int_{- \infty}^{\infty} \frac{1}{\sqrt{2 \pi} \sigma} e^{ - \frac{(x - (\sigma^2 \theta + \mu))^2}{2 \sigma^2} } dx \\ \end{alignat*}

となる。ここで、

12πσe(x(σ2θ+μ))22σ2 \frac{1}{\sqrt{2 \pi} \sigma} e^{- \frac{(x - (\sigma^2 \theta + \mu))^2}{2 \sigma^2}}

について、これは平均がσ2θ+μ\sigma^2 \theta + \mu、分散がσ2\sigma^2の正規分布の確率密度関数である。すると、この確率密度関数は次の性質を持つ。

12πσe(x(σ2θ+μ))22σ2dx=1 \int_{- \infty}^{\infty} \frac{1}{\sqrt{2 \pi} \sigma} e^{- \frac{(x - (\sigma^2 \theta + \mu))^2} {2 \sigma^2} } dx = 1

ゆえに、m(θ)m(\theta)

m(θ)=E[eθX]=eσ2θ22+μθ12πσe(x(σ2θ+μ))22σ2dx=eσ2θ22+μθ1=eσ2θ22+μθ \begin{alignat*}{2} m(\theta) &= E[e^{\theta X}] \\ &= e^{\frac{\sigma^2 \theta^2}{2} + \mu \theta} \int_{- \infty}^{\infty} \frac{1}{\sqrt{2 \pi} \sigma} e^{ - \frac{(x - (\sigma^2 \theta + \mu))^2}{2 \sigma^2} } dx \\ &= e^{\frac{\sigma^2 \theta^2}{2} + \mu \theta} \cdot 1\\ &= e^{\frac{\sigma^2 \theta^2}{2} + \mu \theta} \\ \end{alignat*}

である。したがって、θ=1\theta = 1とすると

m(1)=E[eX]=E[Y]=eσ22+μ \begin{alignat*}{2} m(1) &= E[e^{X}] \\ &= E[Y] \\ &= \underline{e^{\frac{\sigma^2}{2} + \mu}} \end{alignat*}

[2] YYの分散を求めよ。
V[Y]V[Y]の値を求める。分散の性質より

V[Y]=E[Y2](E[Y])2=E[(eX)2](E[eX])2 \begin{alignat*}{2} V[Y] &= E[Y^2] - (E[Y])^2 \\ &= E[(e^X)^2] - (E[e^X])^2 \\ \end{alignat*}

であるので、つまりE[(eX)2](E[eX])2E[(e^X)^2] - (E[e^X])^2を求めればよい。

E[e^X]の値は[1]より求めているので、E[(eX)2]E[(e^X)^2]の値を求める。
これは、XXモーメント母関数

m(θ)=E[eθX] m(\theta) = E[e^{\theta X}]

において、θ=2\theta = 2と置けばよいのでE[e2X]E[e^{2 X}]の値は、

E[e2X]=e2μ+2σ2 \begin{alignat*}{2} E[e^{2 X}] = e^{2 \mu + 2 \sigma^2} \end{alignat*}

である。したがって求めるYYの分散は

V[Y]=E[(eX)2](E[eX])2=e2μ+2σ2(eμ+σ22)2=e2μ+2σ2e2μ+σ2=e2μ+σ2eσ2e2μ+σ2=e2μ+σ2(eσ21) \begin{alignat*}{2} V[Y] &= E[(e^X)^2] - (E[e^X])^2 \\ &= e^{2 \mu + 2 \sigma^2} - \left( e^{\mu + \frac{\sigma^2}{2}} \right)^2 \\ &= e^{2 \mu + 2 \sigma^2} - e^{2\mu + \sigma^2} \\ &= e^{2 \mu + \sigma^2} \cdot e^{\sigma^2} - e^{2\mu + \sigma^2} \\ &= \underline{e^{2 \mu + \sigma^2} \left( e^{\sigma^2} - 1 \right)} \\ \end{alignat*}

[3] YYの確率密度関数を求めよ。

y=exx=logy y = e^x \Leftrightarrow x = \log y

であり、また

y=exdydx=(ex)dx=1exdy=1elogydy=1ydy \begin{alignat*}{2} y &= e^x \\ \cfrac{dy}{dx} &= \left( e^x \right)^\prime \\ dx &= \cfrac{1}{e^x} dy \\ &= \cfrac{1}{e^{\log y}} dy \\ &= \cfrac{1}{y} dy \\ \end{alignat*}

であるので、YYの確率密度関数は

12πσ e(logyμ)22σ21y=12πσy e(logyμ)22σ2 \begin{alignat*}{2} \cfrac{1}{\sqrt{2 \pi} \sigma} \ e^{- \frac{( \log y - \mu )^2}{2 \sigma^2}} \cdot \cfrac{1}{y} &= \underline{ \cfrac{1}{\sqrt{2 \pi} \sigma y} \ e^{- \frac{( \log y - \mu )^2}{2 \sigma^2}} } \end{alignat*}

参考資料

記事が役に立った方は「いいね」を押していただけると、すごく喜びます \bf{\textcolor{red}{記事が役に立った方は「いいね」を押していただけると、すごく喜びます \ 笑}}
ご協力のほどよろしくお願いします。

Discussion

ログインするとコメントできます