やること
https://www.amazon.co.jp/dp/4254209444
を読んで、確率微分方程式による最適化問題を解けるようになることです。
これまでのBotter自主ゼミノート
Botter自主ゼミノート 1.2 確定システムの制御の回顧
Botter自主ゼミノート 2.1 確率過程とは?, 2.2 確率過程の数学的表現
Botter自主ゼミノート 1.2 数式導出
Botter自主ゼミノート 2.3 確率モーメント
Botter自主ゼミノート 2.4 確率過程の分類
Botter自主ゼミノート 2.5 エルゴード性
Botter自主ゼミノート 2.6 確率過程の周波数表現
Botter自主ゼミノート 2.7 マルコフ過程
Botter自主ゼミノート 2.8 正規型確率過程
Botter自主ゼミノート 2.9 ウィーナ過程(1)
Botter自主ゼミノート 2.9 ウィーナ過程(2)
Botter自主ゼミノート 2.10 白色雑音
Botter自主ゼミノート 3.1, 3.2 確率変数列の収束
Botter自主ゼミノート 3.3 確率過程の連続性
Botter自主ゼミノート 3.4 自乗平均微分
Botter自主ゼミノート 3.5 自乗平均積分
Botter自主ゼミノート 4.1 確率微分方程式とは?
Botter自主ゼミノート 4.2 確率積分
Botter自主ゼミノート 4.2 確率積分 例題4.1
Botter自主ゼミノート 4.3 確率微分方程式
Botter自主ゼミノート 4.4 伊藤の確率微分演算
Botter自主ゼミノート 4.5 拡散過程
Botter自主ゼミノート 4.6 確率密度関数の時間進化 - コルモゴロフ方程式
Botter自主ゼミノート 6.1 動的システムの推定とは?
6.2 条件付き確率密度関数の時間進化
6.1節で、式(6.1)で表される動的システムの状態量x(t)に対する最適推定値は、式(6.2)で与えられる観測データの集積である\mathcal{Y}_tの条件付き期待値\hat{x}(t|t) = \mathcal{E}\{x(t)|\mathcal{Y}_t\}で与えられることがわかりました。
\hat{x}(t|t)を求めようとすると、
\hat{x}(t|t) = \int_{R^n} x\:p\{t,x|\mathcal{Y}_t\} \tag{6.11}
であるので、\hat{x}(t|t)を求めることは、条件付き確率密度関数p\{t,x|\mathcal{Y}_t\}を求めることと同じであることがわかります。教科書では、これを直接求めることは非常に難しいとした上で、推定値の時間進化d\hat{x}(t|t)に注目して、以下の式のように考え、p\{t,x|\mathcal{Y}_t\}の代わりにdp\{t,x|\mathcal{Y}_t\}を求めています。
d\hat{x}(t|t) = \int_{R^n} x\:dp(\{t, x|\mathcal{Y}_t\}dx \tag{6.12}
微小時間区間[t, t+\delta t)で得られた観測値を\delta y_t = \delta y(t)とすると、その時間で確率密度関数に与えた変化\delta pは以下のように表せます。
\begin{aligned}
\delta_p &= p\{t+\delta_t, x|\mathcal{Y}_{t+\delta_t}\} - p\{t,x|\mathcal{Y}_t\} \\
&= [p\{t+\delta_t, x|\mathcal{Y}_{t+\delta_t}\} - p\{t, x|\mathcal{Y}_{t+\delta_t}\}] + [p\{t, x|\mathcal{Y}_{t+\delta_t}\} - p\{t, x|\mathcal{Y}_t\}] \\
&:= \delta p_d + \delta p_o \tag{6.13}
\end{aligned}
システム雑音\{w(t)\}と観測雑音\{v(t)\}が互いに独立であると仮定すると、\delta p_dと\delta p_oは互いに独立になり、別々に計算することができるようになります。
\delta p_dについては、観測値の条件\mathcal{Y}_{t+\delta t}は変わらず、ダイナミクスのみによる変化であるため、すでに導出したコルモゴロフの前向き方程式そのものとなります。
\delta p_d = \mathcal{L}_x^* p\{t,x|\mathcal{Y}_{t+\delta_t}\}\delta t+o(\delta_t) \tag{6.14}
続けて\delta p_oについては、観測値の条件の変化からどのような影響が確率密度関数似合ったかということを表すことになります。
…となるので、これより
\delta p_o = (h-\hat{h})^T (R_t R_t^T)^{-1} (\delta y_t - \hat{h}\delta t)p\{t,x|\mathcal{Y}_t\} \tag {6.24}
となります。
また、式(6.23)を式(6.14)に代入し、(\delta y_t - \hat{h}\delta t) \sim o(\delta t^{\frac{1}{2}})であることに留意すると
\delta p_d = \mathcal{L}_x^* p\{t,x|\mathcal{Y}_t\} \delta t + o(\delta t^{\frac{3}{2}}) \tag{6.25}
となるので、式(6.24)と式(6.25)を式(6.13)に代入して、\delta t \to 0とすることで、p\{t,x|\mathcal{Y}_t\}についての以下の確率偏微分積分方程式(6.26)が得られます。
dp\{t,x|\mathcal{Y}_t\} = \mathcal{L}_x^* p\{t,x|\mathcal{Y}_t\} dt + p\{t,x|\mathcal{Y}_t\}[h(t,x)-\hat{h}(t,x)]^T (R_t R_t^T)^{-1} \{dy(t)-\hat{h}(t,x)dt\}
また、\hat{h}は以下のように定義されます。
\hat{h}(t,x) = \int_{R^n} h(t,x) p\{t,x|\mathcal{Y}_t\} dx \tag{6.27}
式(6.26)がクスナー方程式です。
クスナー方程式は、pについての非線形方程式です。右辺第一項がダイナミクスの変動によるpの変化を表すコルモゴロフの方程式そのものであり、第二項が観測値\delta y(t)が増えたことによってpの変化を修正する項となっていることを教科書では強調しています。
もし、観測雑音が大きすぎて観測データが無意味になってしまうか、観測雑音がなくなる((R_t R_t^T)^-1 \equiv 0)となると、式(6.26)はコルモゴロフの前向き方程式に帰着します。
クスナー方程式は非線形確率偏微分積分方程式ですが、6.7節と6.8節で紹介する変換を施すことで線形方程式となります。
Discussion