📘

線形回帰と正規事前分布

2023/02/11に公開約3,400字

多変量正規事前分布を仮定


(a) 事前分布。(b) 事後分布。

正規分布に従う残差を仮定した場合の線形回帰モデル

\begin{aligned} p(\bm y | \bm X, \bm w) = \mathcal N_D(\bm y | \bm X \bm w, \sigma^2 \bm I_D) \end{aligned}

に対し、パラメータ \bm w の事前分布として多変量正規分布を仮定する。

\begin{aligned} p(\bm w) &= \mathcal N_N(\bm w | \bm m_0, \bm V_0) \\ &\propto \exp \left( -\frac{1}{2} (\bm w - \bm m_0)^\mathsf{T} \bm V_0^{-1} (\bm w - \bm m_0) \right) \end{aligned}

このときの事後分布を計算してみよう。

\begin{aligned} p(\bm w | \bm X, \bm y) \propto{}& p(\bm y | \bm X, \bm w) p(\bm w) \\ ={}& \mathcal N_D(\bm y | \bm X \bm w, \bm I_D) \mathcal N_N(\bm w | \bm m_0, \bm V_0) \\ \propto{}& \exp \left( -\frac{1}{2\sigma^2} \|\bm y - \bm X \bm w\|_2^2 \right) \exp \left( -\frac{1}{2} (\bm w - \bm m_0)^\mathsf{T} \bm V_0^{-1} (\bm w - \bm m_0) \right) \\ ={}& \exp \left( - \frac{1}{2} \underbrace{\left( \frac{1}{\sigma^2} \|\bm y - \bm X \bm w\|_2^2 + (\bm w - \bm m_0)^\mathsf{T} \bm V_0^{-1} (\bm w - \bm m_0) \right)}_{(1)} \right) \\ &\left|\small\quad\begin{aligned} (1) ={}& \frac{1}{\sigma^2} \|\bm y - \bm X \bm w\|_2^2 + (\bm w - \bm m_0)^\mathsf{T} \bm V_0^{-1} (\bm w - \bm m_0) \\ ={}& \bm w^\mathsf{T} \frac{1}{\sigma^2} \bm X^\mathsf{T} \bm X \bm w + \bm w^\mathsf{T} \frac{1}{\sigma^2} \bm V_0^{-1} \bm w - 2 \bm w^\mathsf{T} \frac{1}{\sigma^2} \bm X^\mathsf{T} \bm y - 2 \bm w^\mathsf{T} \bm V_0^{-1} \bm m_0 + \mathrm{const.} \\ ={}& \bm w^\mathsf{T} \underbrace{\left( \frac{1}{\sigma^2} \bm X^\mathsf{T} \bm X + \bm V_0^{-1} \right)}_{\bm V_w^{-1}} \bm w - 2 \bm w^\mathsf{T} \underbrace{\left( \frac{1}{\sigma^2} \bm X^\mathsf{T} \bm y + \bm V_0^{-1} \bm m_0 \right)}_{\bm V_w^{-1} \bm m_w} + \mathrm{const.} \\ ={}& \bm w^\mathsf{T} \bm V_w^{-1} \bm w - 2 \bm w^\mathsf{T} \bm V_w^{-1} \bm m_w + \mathrm{const.} \\ ={}& (\bm w - \bm m_w)^\mathsf{T} \bm V_w^{-1} (\bm w - \bm m_w) + \mathrm{const.} \end{aligned}\right. \\ \propto{}& \exp \left( -\frac{1}{2} (\bm w - \bm m_w)^\mathsf{T} \bm V_w^{-1} (\bm w - \bm m_w) \right) \\ \propto{}& \mathcal N_N (\bm w | \bm m_w, \bm V_w) \end{aligned}

よって事後分布は次のようになる。

p(\bm w | \bm X, \bm y) = \mathcal N_N(\bm w | \bm m_w, \bm V_w)
\left\lbrace\begin{aligned} \bm m_w &= \bm V_w \left( \frac{1}{\sigma^2} \bm X^\mathsf{T} \bm y + \bm V_0^{-1} \bm m_0 \right) \\ \bm V_w^{-1} &= \frac{1}{\sigma^2} \bm X^\mathsf{T} \bm X + \bm V_0^{-1} \end{aligned}\right.

共役事前分布

このように、正規分布を尤度関数として採用し、事前分布として多変量正規分布を使用した場合、事後分布もまた多変量正規分布となる。

一般に、尤度関数 p(\mathcal D | w) に対して事前分布 p(w) と事後分布 p(w | \mathcal D) が同じ形である場合、事前分布 p(w) を尤度関数 p(\mathcal D | w)共役事前分布 (conjugate prior) という。特に、尤度関数、事前分布、事後分布ともに同じ 分布族 (family) に属す場合、自然共役 (natural conjugate) であるといわれる。

今回の場合は、正規分布 (事前分布) は正規分布 (尤度関数) の自然共役事前分布であるという事実に由来する。

分布 分布族
p(w) 正規分布 指数分布族
p(\mathcal D | w) 正規分布 指数分布族
p(w | \mathcal D) 正規分布 指数分布族

まとめ

  • 多変量正規事前分布: パラメータ \bm w の事前分布として多変量正規分布を仮定

  • 事後分布のパラメータは次式で与えられる

    \left\lbrace\begin{aligned} \bm m_w &= \bm V_w \left( \frac{1}{\sigma^2} \bm X^\mathsf{T} \bm y + \bm V_0^{-1} \bm m_0 \right) \\ \bm V_w^{-1} &= \frac{1}{\sigma^2} \bm X^\mathsf{T} \bm X + \bm V_0^{-1} \end{aligned}\right.

Discussion

ログインするとコメントできます