はじめに
この記事では、統計検定準1級取得に向けて学習したことをまとめていきます。
工学系の数学ではなく数理あるあるの、論述ゴリゴリな解答になっていると思いますのであらかじめご了承ください。
注意:さらに計算過程は数学文化の『省略の美』を無視してエレファントに書いています。
【リンク紹介】
・統計検定準1級のまとめ記事一覧
・これまで書いたシリーズ記事一覧
学習書籍について
この記事では「統計学実践ワークブック」を中心に、学んだことをまとめていきます。記事を読んで本格的に勉強してみたいなと思った方は、是非ご購入を検討なさってください。

参考書籍について
統計実践ワークブックは、大量の知識項目と問題が収められている反面、計算過程や知識背景が大きく省略されているため、知識体系をきちんと学ぶ参考書として東京大学から出版されている名著「統計学入門」を使っています。
※ワークブックとしては素晴らしい質だと思いますが、どうしてもその内容量とページ数の都合上、問題のない範囲で削除されているということです。人によっては1冊で問題ない方もおられると思いますが、私には無理でした。

前提知識
前提知識の定義
x,y :変数
X,Y :確率変数
f(x) :Xの確率密度関数
f(x,y) :XとYの同時確率密度関数
E[X] :Xの期待値
V[X] :Xの分散
m(θ):モーメント母関数
確率密度関数の変数変換
連続型の確率変数Xの確率密度関数をf(x)とする。そして確率変数YをY=g(X)とする。ただし、g(x)は1対1の関数(単調増加(減少)関数)とする。このとき、Yの確率密度関数は次の式で表される。
f(g−1(y))⋅∣g′(g−1(y))∣1
※ここでの記号∣∣は、絶対値記号である。
導出
f(x)はXの確率密度関数であるから、Xの取りうる値をa≦X≦bとすると、定義より
P(a≦X≦b)=∫abf(x)dx
が成り立つ。ここでy=g(x)とすると、a≦x≦bに対して
g(a)≦y≦g(b) ⋯①
であり、またgは1対1の関数であるため逆関数を持つ。つまり
x=g−1(y) ⋯②
が成り立つ。さらに
ydxdydx=g(x)=g′(x)=g′(x)1dy ⋯③
であり、以上①~③より
P(a≦X≦b)=∫abf(x)dx=∫g(a)g(b)f(g−1(y))⋅g′(x)1dy=∫g(a)g(b)f(g−1(y))⋅∣g′(f−1(y))∣1dy=P(g(a)≦Y≦g(b))
である。したがって、Yの確率密度関数は、
f(g−1(y))⋅∣g′(g−1(y))∣1
である。
例題
(「統計学実践ワークブック」より)
問4.1
確率変数Xは正規分布N(μ,σ2)に従い、その確率密度関数はf(x)=2πσ1e−2σ2(x−μ)2であるとする。このとき、確率変数YをY=eXとする。
[1] Yの期待値を求めよ。
[2] Yの分散を求めよ。
[3] Yの確率密度関数を求めよ。
解答
[1] Yの期待値を求めよ。
E[Y]つまりE[e^X]の値を求める。
Xのモーメント母関数は、Xが連続型であることから
定義より、
m(θ)=E[eθX]=∫−∞∞eθxf(x)dx
である。ここで、Xは正規分布に従うことから、確率密度関数f(x)は
f(x)=2πσ1e−2σ2(x−μ)2
である。よって、
m(θ)=E[eθX]=∫−∞∞eθx⋅2πσ1e−2σ2(x−μ)2dx=∫−∞∞2πσ1eθx−2σ2(x−μ)2dx
である。ここで、
θx−2σ2(x−μ)2=2σ22σ2θx−2σx2−2μx+μ2=−2σ2x2−2(σ2θ+μ)x+μ2=−2σ2{x2−2(σ2θ+μ)x+(σ2θ+μ)2}−(σ2θ+μ)2+μ2=−2σ2(x−(σ2θ+μ))2−σ4θ2−2σ2μθ=−2σ2(x−(σ2θ+μ))2+2σ2σ4θ2+2σ2θ=−2σ2(x−(σ2θ+μ))2+2σ2θ2+μθ
であるから、
m(θ)=E[eθX]=∫−∞∞eθx⋅2πσ1e−2σ2(x−μ)2dx=∫−∞∞2πσ1eθx−2σ2(x−μ)2dx=∫−∞∞2πσ1e(−2σ2(x−(σ2θ+μ))2+2σ2θ2+μθ)dx=e2σ2θ2+μθ∫−∞∞2πσ1e−2σ2(x−(σ2θ+μ))2dx
となる。ここで、
2πσ1e−2σ2(x−(σ2θ+μ))2
について、これは平均がσ2θ+μ、分散がσ2の正規分布の確率密度関数である。すると、この確率密度関数は次の性質を持つ。
∫−∞∞2πσ1e−2σ2(x−(σ2θ+μ))2dx=1
ゆえに、m(θ)は
m(θ)=E[eθX]=e2σ2θ2+μθ∫−∞∞2πσ1e−2σ2(x−(σ2θ+μ))2dx=e2σ2θ2+μθ⋅1=e2σ2θ2+μθ
である。したがって、θ=1とすると
m(1)=E[eX]=E[Y]=e2σ2+μ
[2] Yの分散を求めよ。
V[Y]の値を求める。分散の性質より
V[Y]=E[Y2]−(E[Y])2=E[(eX)2]−(E[eX])2
であるので、つまりE[(eX)2]−(E[eX])2を求めればよい。
E[e^X]の値は[1]より求めているので、E[(eX)2]の値を求める。
これは、Xモーメント母関数
m(θ)=E[eθX]
において、θ=2と置けばよいのでE[e2X]の値は、
E[e2X]=e2μ+2σ2
である。したがって求めるYの分散は
V[Y]=E[(eX)2]−(E[eX])2=e2μ+2σ2−(eμ+2σ2)2=e2μ+2σ2−e2μ+σ2=e2μ+σ2⋅eσ2−e2μ+σ2=e2μ+σ2(eσ2−1)
[3] Yの確率密度関数を求めよ。
y=ex⇔x=logy
であり、また
ydxdydx=ex=(ex)′=ex1dy=elogy1dy=y1dy
であるので、Yの確率密度関数は
2πσ1 e−2σ2(logy−μ)2⋅y1=2πσy1 e−2σ2(logy−μ)2
参考資料
記事が役に立った方は「いいね」を押していただけると、すごく喜びます 笑
ご協力のほどよろしくお願いします。
Discussion