🦁

線形ガウス状態空間モデル(2) - ローカルレベルモデル

2023/09/03に公開

ローカルレベルモデル

定義 [1, p193]

以下の式で表される状態空間モデルをローカルレベルモデルと呼ぶ。

\mu_t = \mu_{t-1}+w_t,\quad w_t\sim N(0, \sigma_w^2) \\ y_t = \mu_t + v_t, \quad v_t\sim N(0, \sigma_v^2)

w_t状態誤差v_t観測誤差と呼ばれる。状態\mu_t水準(レベル) とも呼ばれる。

データの生成過程の仮定

ローカルレベルモデルは、状態も観測値も、生成過程が正規分布だと仮定するモデルである。
このことは、上記の式を、以下のように変形すると、よりわかりやすくなる。

\mu_t \sim N(\mu_{t-1}, \sigma_w^2) \\ y_t \sim N(\mu_t, \sigma_v^2)

また、状態 \mu_tの式より、 \mu_t はランダムウォーク系列であることがわかる。
\mu_0 = 0 と考えると、ホワイトノイズ(平均0の正規分布)の累積和が \mu_t となっている。[1, p193]

具体例: 毎日の体重の測定[2]

  • 状態誤差: 水の量や、食べているもの起因の誤差
  • 観測誤差: 体重計が持つ誤差

ただし、暴飲暴食はせず、ある程度一定の体重になることがわかっている人に限る。
暴飲暴食をする場合、(おそらく)状態はトレンドを持つ時系列になるはずだから。

モデルの推定 [1, p193]

ローカルレベルモデルの推定は、 \sigma_w^2\sigma_v^2 、この2つの分散を定めることを指す。

モデルの予測 [1, p195]

状態推定モデルの予測は、以下のように状態の期待値を計算することで実施される。

E(\mu_t|\mu_{t-1})

日本語で書くと「現時点までの状態が確定した条件下での、未来の状態の期待値」。

信頼区間付きの予測

観測誤差は、観測時に現れる誤差なので、予測値も観測誤差分はズレうることになる。
このことを表現するために、信頼区間付きの予測値がグラフ化されていることがある。
この信頼区間は、観測誤差 \sigma_v^2 を使って計算されている。
正規分布の95%信頼区間は大体平均から ± なので、 ローカルレベルモデルでは、E(\mu_t|\mu_{t-1})から上下に 2\sigma_v の範囲が信頼区間である。
数式で書くと、以下の確率変数 y_t' を図示したものになる。

y_t' = E(\mu_t|\mu_{t-1}) + v_t, \quad v_t\sim N(0, \sigma_v^2)

他モデルとの比較

ローカルレベルモデルと線形回帰モデルの比較

ローカルレベルモデルは線形回帰モデルの特殊系と考えることができる。

線形回帰モデルは以下であった。

y_t = w_0 + w_1x_{1t}...+w_nx_{nt} + \epsilon_t,\quad \epsilon_t\sim N(0, \sigma_{\epsilon}^2)

線形回帰モデルは以下を仮定するとローカルレベルモデルになる。

  • 説明変数(xのこと)がなく
  • w_0が時間に依存するとし、一期前の w_0 に誤差を加えたもの

確認のために、時間に依存するようになったw_0を改めて\mu_tと表記して書き直してみる。

\mu_t = \mu_{t-1}+w_t,\quad w_t\sim N(0, \sigma_w^2) \\ y_t=\mu_t + \epsilon_t, \quad \epsilon_t\sim N(0, \sigma_\epsilon^2)

ローカルレベルモデルの式と一致していることが確認できる。

ローカルレベルモデルとARIMAモデルの関係 [1, p195, p46]

観測値 y_ty_{t-1} を考える。

y_t = \mu_t + v_t \\ y_{t-1} = \mu_{t-1} + v_{t-1}

この2式から、状態 \mu_t を削除して誤差のみが残る形に変形する。
y_tの式に状態方程式 \mu_t = \mu_{t-1} + w_t を代入して、上下の差分を取ることで以下を得る。

y_t - y_{t-1} = w_t + v_t - v_{t-1}

上の式から、ローカルレベルモデルは、ARIMA(0, 1, 1) に一致することがわかる。
自己回帰成分がなく、1階の差分系列を扱い、1期前の観測誤差が入っているため。

参考文献

Discussion