✍️

ガンベル分布に従う独立な確率変数の差がロジスティック分布に従うことの導出

2024/06/09に公開

はじめに

この記事では，ガンベル分布に従う独立な確率変数の差が，ロジスティック分布に従うことを示す．この性質は，ある人がものを買うかどうか，あるペアが結婚するかどうかなど，ある主体が離散的な選択肢の中から何かを選択する離散選択 (discrete choice) 行動を分析する際に，しばしば用いられるようである．分析のイメージを簡単に述べると，ある人が $i$ という選択をしたときの効用^[1] $U_i$ を，

\begin{equation} U_i = \text{observable}_i + \varepsilon_i \end{equation}

と分析者にとって観測可能な部分 $\text{observable}_i$ と観測不可能な部分 $\varepsilon_i$ に分解すれば，次式が成り立つ．

\begin{align} U_i > U_j &\iff \text{observable}_i + \varepsilon_i > \text{observable}_j + \varepsilon_j \\ &\iff \varepsilon_j - \varepsilon_i < \text{observable}_i - \text{observable}_j \qquad (j \neq i) \end{align}

$U_i > U_j$ は選択肢 $i$ を選んだときの効用が $j$ よりも大きいことを表すので，選択肢 $i$ が選ばれる確率は

\begin{equation} \Pr(U_i > U_j) = \Pr(\varepsilon_j - \varepsilon_i < \text{observable}_i - \text{observable}_j) \end{equation}

と累積分布関数の形で書ける．ここで， $\varepsilon_i,\varepsilon_j$ がガンベル分布に従う独立なショック（確率変数）だと仮定すると，この選択確率がロジスティック分布（の累積分布関数）で与えられるというわけだ．

本記事は，離散選択理論の解説記事ではないのでこれ以上深入りしないが，この導入を書くにあたって以下の記事にお世話になった．この場を借りてお礼申し上げます．

分布の基本情報

まずは蓑谷 (2010) を参考に，ガンベル極値分布とロジスティック分布の特性を記す．

ガンベル極値分布

同一の分布に従う $n$ 個の独立な連続確率変数のなかで，最大値 $X$ の極限分布が極値分布である．極値分布のうち，タイプ１と呼ばれるものがガンベル分布 (Gumbel distribution) である．

ガンベル分布の確率密度関数は

\begin{equation} f(x) = \frac{1}{\theta}\exp\left(-\frac{x-\mu}{\theta}\right)\exp\left[-\exp\left(-\frac{x-\mu}{\theta}\right)\right] \qquad (-\infty < x < \infty) \end{equation}

で与えられ， $-\infty < \mu < \infty,\ \theta > 0$ の二つのパラメータで指定される．その累積分布関数は

\begin{equation} F(x) = \exp\left[-\exp\left(-\frac{x-\mu}{\theta}\right)\right] \end{equation}

である．モーメント母関数は

\begin{equation} M_X(t) = E\left[e^{tX}\right] = \exp(\mu t)\Gamma(1-\theta t) \qquad \left(t<\frac{1}{\theta}\right) \end{equation}

であり， $t$ を虚数 $it$ に置き換えることで，特性関数

\begin{equation} \phi_X(t) = E\left[e^{itX}\right] = \exp(i\mu t)\Gamma(1-i\theta t) \end{equation}

を得る．

ロジスティック分布

ロジスティック分布 (logistic distribution) の確率密度関数は，

\begin{equation} f(x) = \frac{\exp(-\frac{x-\mu}{\theta})}{\theta\left[ 1+\exp(-\frac{x-\mu}{\theta}) \right]^2} \qquad (-\infty < x < \infty) \end{equation}

で与えられ， $\mu, \theta > 0$ の二つのパラメータで指定される．その累積分布関数は，

\begin{equation} F(x) = 1 - \frac{1}{\left[ 1+\exp(-\frac{x-\mu}{\theta}) \right]} \end{equation}

である．モーメント母関数は

\begin{align} M_X(t) &= \exp(\mu t)\Gamma(1-\theta t)(1+\theta t) \\ &= \frac{\pi\theta t\exp(\mu t)}{\sin(\pi\theta t)} \end{align}

であり， $t$ を虚数 $it$ に置き換えることで，特性関数

\begin{equation} \phi_X(t) = \frac{\exp(i\mu t)i\pi\theta t}{\sin(i\pi\theta t)} \end{equation}

を得る．

導出

この性質を導くアプローチは二つある．一つは，変数変換（畳み込み）を用いてロジスティック分布の確率密度関数を直接求める方法であり，もう一つは $Z$ が従う分布の特性関数とロジスティック分布の特性関数が一致することを確かめる方法である．

変数変換（畳み込み）によるアプローチ

確率分布の差を求める公式として， $X$ と $Y$ が独立なら

f_{X-Y}(z) = \int_{-\infty}^\infty dv f_X(z+v)f_Y(v) \tag{convolution}

という $f_X(x)$ と $f_Y(y)$ の畳み込みの形をとった式がある．ただし， $f_{X-Y}(\cdot), f_X(\cdot), f_Y(\cdot)$ はそれぞれ $X-Y, X, Y$ の確率密度関数である．まずは $\text{(convolution)}$ を求めるために，累次積分を使う方法とヤコビアンを用いた方法を見ていく．

累次積分による導出

確率変数 $X,Y$ の同時確率密度関数を $f(x,y)$ とする． $X$ と $Y$ は独立なので， $f(x,y)=f_X(x)f_Y(y)$ である． $X-Y$ の累積分布関数は，

\begin{align} F_{X-Y}(z) &= \Pr(X-Y\leq z) \\ &= \iint_{u-v\leq z}f(u,v)dudv \\ &= \int_{-\infty}^\infty dv \int_{-\infty}^{z+v} f(u,v)du \\ &= \int_{-\infty}^\infty dv f_Y(v)\int_{-\infty}^{z+v} f_X(u)du. \end{align}

$X-Y$ の確率密度関数を得るために，累積分布関数を $z$ で微分すると，

\begin{align} f_{X-Y}(z) &= \frac{d}{dz}F_{X-Y}(z) \\ &= \int_{-\infty}^\infty dv f_Y(v)\frac{d}{dz}\int_{-\infty}^{z+v} f_X(u)du \\ &= \int_{-\infty}^\infty dv f_Y(v)f_X(z+v) \end{align}

となり， $\text{(convolution)}$ を得る．

ヤコビアンを使った導出

$Z=X-Y$ の確率分布を考える． $Z=X-Y,\ V=Y$ と変数変換すると， $x=z+v,\ y=v$ となるので，ヤコビアンは

\begin{equation} J = \begin{vmatrix} \displaystyle \frac{\partial x}{\partial z} & \displaystyle \frac{\partial x}{\partial v} \\ \displaystyle \frac{\partial y}{\partial z} & \displaystyle \frac{\partial y}{\partial v} \end{vmatrix} = \begin{vmatrix} 1 & 1 \\ 0 & 1 \end{vmatrix} =1. \end{equation}

$Z$ と $V$ の同時確率密度関数は，

\begin{align} f(z,v) &= f(x,y)|J| \\ &= f_X(x)f_Y(y)|J| \\ &= f_X(z+v)f_Y(v) \end{align}

となる．求めるのは $Z$ の分布なので， $Z$ と $V$ の同時確率密度 $f(z,v)$ を $-\infty<v<\infty$ で積分して周辺化すれば良い．
よって，

\begin{equation} f_Z(z) = \int_{-\infty}^\infty f_X(z+v)f_Y(v)dv \end{equation}

であり， $\text{(convolution)}$ を得る．

ロジスティック分布の確率密度関数の導出

$\text{(convolution)}$ にガンベル分布の確率密度関数を代入して，

\begin{align*} f_Z(z) &= \int_{-\infty}^\infty dv f(z+v)f(v) \\ &= \int_{-\infty}^\infty dv \frac{1}{\theta}\exp\left(-\frac{z+v-\mu}{\theta}\right)\exp\left[-\exp\left(-\frac{z+v-\mu}{\theta}\right)\right]\frac{1}{\theta}\exp\left(-\frac{v-\mu}{\theta}\right)\exp\left[-\exp\left(-\frac{v-\mu}{\theta}\right)\right] \\ &= \frac{1}{\theta^2}\exp\left(-\frac{z}{\theta}\right) \int_{-\infty}^\infty dv \exp\left(-2\frac{v-\mu}{\theta}\right)\exp\left[-\exp\left(-\frac{v-\mu}{\theta}\right)-\exp\left(-\frac{z+v-\mu}{\theta}\right)\right] \\ &= \frac{1}{\theta^2}\exp\left(-\frac{z}{\theta}\right) \int_{-\infty}^\infty dv \exp\left(-2\frac{v-\mu}{\theta}\right)\exp\left\{-\exp\left(-\frac{v-\mu}{\theta}\right)\left[1+\exp\left(-\frac{z}{\theta}\right)\right]\right\}. \end{align*}

ここで，次のような置換積分を行う．

\begin{equation} t = \exp\left(-\frac{v-\mu}{\theta}\right)\left[1+\exp\left(-\frac{z}{\theta}\right)\right] \end{equation}

とすると

\begin{equation} \exp\left(-\frac{v-\mu}{\theta}\right) = t\left[1+\exp\left(-\frac{z}{\theta}\right)\right]^{-1} \end{equation}

であり，また

\begin{equation} \frac{dt}{dv} = -\frac{1}{\theta}\exp\left(-\frac{v-\mu}{\theta}\right)\left[1+\exp\left(-\frac{z}{\theta}\right)\right] \end{equation}

である．積分範囲は

\begin{array}{c|rcc} v & -\infty & \rightarrow & \infty \\ \hline t & \infty & \rightarrow & 0 \end{array}

となるので， $f_Z(z)$ は

\begin{align} f_Z(z) &= \int_{-\infty}^\infty dv f(z+v)f(v) \notag \\ &= \frac{1}{\theta^2}\exp\left(-\frac{z}{\theta}\right) \int_{-\infty}^\infty dv \exp\left(-2\frac{v-\mu}{\theta}\right)\exp\left\{-\exp\left(-\frac{v-\mu}{\theta}\right)\left[1+\exp\left(-\frac{z}{\theta}\right)\right]\right\} \notag \\ &= \frac{1}{\theta^2}\exp(-\frac{z}{\theta}) \int_{\infty}^0 dt \left\{-\theta\left[1+\exp\left(-\frac{z}{\theta}\right)\right]^{-1}\right\}\left\{t\left[1+\exp\left(-\frac{z}{\theta}\right)\right]^{-1}\right\} e^{-t} \\ &= \frac{1}{\theta}\exp\left(-\frac{z}{\theta}\right) \int_{0}^\infty dt \left[1+\exp\left(-\frac{z}{\theta}\right)\right]^{-2}te^{-t} \\ &= \frac{1}{\theta}\exp\left(-\frac{z}{\theta}\right)\left[1+\exp\left(-\frac{z}{\theta}\right)\right]^{-2}\int_{0}^\infty te^{-t} dt \\ &= \frac{1}{\theta}\exp\left(-\frac{z}{\theta}\right)\left[1+\exp\left(-\frac{z}{\theta}\right)\right]^{-2}\Gamma(2) \\ &= \frac{\exp\left(-\frac{z}{\theta}\right)}{\theta\left[1+\exp\left(-\frac{z}{\theta}\right)\right]^2} \qquad \Bigl(= f_{\text{Logistic}}(z;\mu=0) \Bigr). \end{align}

以上より， $X,Y\overset{\text\small\textrm{iid}}{\sim} \textrm{Gumbel}(\mu,\theta)$ であるとき， $Z=X-Y$ はパラメータ $\mu=0,\theta$ のロジスティック分布に従う．

特性関数によるアプローチ

パラメータ $-\infty < \mu < \infty,\ \theta > 0$ のガンベル分布の特性関数は，

\begin{equation} \phi_X(t) = \exp(i\mu t)\Gamma(1-i\theta t) \end{equation}

である． $X,Y\overset{\text\small\textrm{iid}}{\sim} \textrm{Gumbel}(\mu,\theta)$ より， $Z=X-Y$ の分布の特性関数は，

\begin{align} \phi_Z(t) &= \phi_X(t)\phi_Y(-t) \\ &= \exp(i\mu t)\Gamma(1-i\theta t)\exp(-i\mu t)\Gamma(1+i\theta t) \\ &= \Gamma(1-i\theta t)\Gamma(1+i\theta t) \\ &= \Gamma(1-i\theta t)(i\theta t)\Gamma(i\theta t) \qquad(\because\text{ガンマ関数の性質}) \\ &= (i\theta t)\Gamma(i\theta t)\Gamma(1-i\theta t) \\ &= (i\theta t)\frac{\pi}{\sin(i\pi\theta t)} \qquad(\because\text{Euler's reflection formula}). \end{align}

最後に用いた Euler's reflection formula とは，ガンマ関数 $\Gamma(z)$ について

\begin{equation} \Gamma(z)\Gamma(1-z) = \frac{\pi}{\sin(\pi z)}, \quad z \notin \mathbb{Z} \end{equation}

が成り立つことをいう．ところで，パラメータ $\mu,\theta > 0$ を持つロジスティック分布の特性関数は

\begin{equation} \phi_{\text{Logistic}}(t) = \frac{\exp(i\mu t)i\pi\theta t}{\sin(i\pi\theta t)} \end{equation}

なので，

\begin{equation} \phi_Z(t) = \frac{i\pi\theta t}{\sin(i\pi\theta t)} = \phi_{\text{Logistic}}(t;\mu=0) \end{equation}

が成り立つ．

以上より，パラメータ $\mu,\theta$ のガンベル分布に従う独立な確率変数の差である $Z=X-Y$ の特性関数が，パラメータ $\mu=0,\theta>0$ のロジスティック分布の特性関数に等しいので， $Z=X-Y$ はパラメータ $\mu=0,\theta>0$ のロジスティック分布に従う．

参考文献

蓑谷千凰彦著, 『統計分布ハンドブック (増補版)』, 朝倉書店, 2010 年.

脚注

その選択をすることで得る満足感のこと．効用自体を観測することはできないが，ある主体が実際にとった選択はデータとして観測可能である．そこで，ある選択をとったのはその効用が他の選択肢に比べて高いからだと解釈する． ↩︎

GitHubで編集を提案