📔

Botter自主ゼミノート 6.2 条件付き確率密度関数の時間進化

2023/02/12に公開

仮想通貨

確率過程

tech

やること

https://www.amazon.co.jp/dp/4254209444
を読んで、確率微分方程式による最適化問題を解けるようになることです。

これまでのBotter自主ゼミノート

6.2 条件付き確率密度関数の時間進化

6.1節で、式(6.1)で表される動的システムの状態量 $x(t)$ に対する最適推定値は、式(6.2)で与えられる観測データの集積である $\mathcal{Y}_t$ の条件付き期待値 $\hat{x}(t|t) = \mathcal{E}\{x(t)|\mathcal{Y}_t\}$ で与えられることがわかりました。

$\hat{x}(t|t)$ を求めようとすると、

\hat{x}(t|t) = \int_{R^n} x\:p\{t,x|\mathcal{Y}_t\} \tag{6.11}

であるので、 $\hat{x}(t|t)$ を求めることは、条件付き確率密度関数 $p\{t,x|\mathcal{Y}_t\}$ を求めることと同じであることがわかります。教科書では、これを直接求めることは非常に難しいとした上で、推定値の時間進化 $d\hat{x}(t|t)$ に注目して、以下の式のように考え、 $p\{t,x|\mathcal{Y}_t\}$ の代わりに $dp\{t,x|\mathcal{Y}_t\}$ を求めています。

d\hat{x}(t|t) = \int_{R^n} x\:dp(\{t, x|\mathcal{Y}_t\}dx \tag{6.12}

微小時間区間 $[t, t+\delta t)$ で得られた観測値を $\delta y_t = \delta y(t)$ とすると、その時間で確率密度関数に与えた変化 $\delta p$ は以下のように表せます。

\begin{aligned} \delta_p &= p\{t+\delta_t, x|\mathcal{Y}_{t+\delta_t}\} - p\{t,x|\mathcal{Y}_t\} \\ &= [p\{t+\delta_t, x|\mathcal{Y}_{t+\delta_t}\} - p\{t, x|\mathcal{Y}_{t+\delta_t}\}] + [p\{t, x|\mathcal{Y}_{t+\delta_t}\} - p\{t, x|\mathcal{Y}_t\}] \\ &:= \delta p_d + \delta p_o \tag{6.13} \end{aligned}

システム雑音 $\{w(t)\}$ と観測雑音 $\{v(t)\}$ が互いに独立であると仮定すると、 $\delta p_d$ と $\delta p_o$ は互いに独立になり、別々に計算することができるようになります。

$\delta p_d$ については、観測値の条件 $\mathcal{Y}_{t+\delta t}$ は変わらず、ダイナミクスのみによる変化であるため、すでに導出したコルモゴロフの前向き方程式そのものとなります。

\delta p_d = \mathcal{L}_x^* p\{t,x|\mathcal{Y}_{t+\delta_t}\}\delta t+o(\delta_t) \tag{6.14}

続けて $\delta p_o$ については、観測値の条件の変化からどのような影響が確率密度関数似合ったかということを表すことになります。

…となるので、これより

\delta p_o = (h-\hat{h})^T (R_t R_t^T)^{-1} (\delta y_t - \hat{h}\delta t)p\{t,x|\mathcal{Y}_t\} \tag {6.24}

となります。

また、式(6.23)を式(6.14)に代入し、 $(\delta y_t - \hat{h}\delta t) \sim o(\delta t^{\frac{1}{2}})$ であることに留意すると

\delta p_d = \mathcal{L}_x^* p\{t,x|\mathcal{Y}_t\} \delta t + o(\delta t^{\frac{3}{2}}) \tag{6.25}

となるので、式(6.24)と式(6.25)を式(6.13)に代入して、 $\delta t \to 0$ とすることで、 $p\{t,x|\mathcal{Y}_t\}$ についての以下の確率偏微分積分方程式(6.26)が得られます。

dp\{t,x|\mathcal{Y}_t\} = \mathcal{L}_x^* p\{t,x|\mathcal{Y}_t\} dt + p\{t,x|\mathcal{Y}_t\}[h(t,x)-\hat{h}(t,x)]^T (R_t R_t^T)^{-1} \{dy(t)-\hat{h}(t,x)dt\}

また、 $\hat{h}$ は以下のように定義されます。

\hat{h}(t,x) = \int_{R^n} h(t,x) p\{t,x|\mathcal{Y}_t\} dx \tag{6.27}

式(6.26)がクスナー方程式です。

クスナー方程式は、 $p$ についての非線形方程式です。右辺第一項がダイナミクスの変動による $p$ の変化を表すコルモゴロフの方程式そのものであり、第二項が観測値 $\delta y(t)$ が増えたことによって $p$ の変化を修正する項となっていることを教科書では強調しています。

もし、観測雑音が大きすぎて観測データが無意味になってしまうか、観測雑音がなくなる( $(R_t R_t^T)^-1 \equiv 0$ )となると、式(6.26)はコルモゴロフの前向き方程式に帰着します。

クスナー方程式は非線形確率偏微分積分方程式ですが、6.7節と6.8節で紹介する変換を施すことで線形方程式となります。

やること

これまでのBotter自主ゼミノート

6.2 条件付き確率密度関数の時間進化

Discussion