やること
https://www.amazon.co.jp/dp/4254209444
を読んで、確率微分方程式による最適化問題を解けるようになることです。
これまでのBotter自主ゼミノート
Botter自主ゼミノート 1.2 確定システムの制御の回顧
Botter自主ゼミノート 2.1 確率過程とは?, 2.2 確率過程の数学的表現
Botter自主ゼミノート 1.2 数式導出
Botter自主ゼミノート 2.3 確率モーメント
Botter自主ゼミノート 2.4 確率過程の分類
Botter自主ゼミノート 2.5 エルゴード性
Botter自主ゼミノート 2.6 確率過程の周波数表現
Botter自主ゼミノート 2.7 マルコフ過程
Botter自主ゼミノート 2.8 正規型確率過程
Botter自主ゼミノート 2.9 ウィーナ過程(1)
Botter自主ゼミノート 2.9 ウィーナ過程(2)
Botter自主ゼミノート 2.10 白色雑音
Botter自主ゼミノート 3.1, 3.2 確率変数列の収束
Botter自主ゼミノート 3.3 確率過程の連続性
Botter自主ゼミノート 3.4 自乗平均微分
Botter自主ゼミノート 3.5 自乗平均積分
Botter自主ゼミノート 4.1 確率微分方程式とは?
Botter自主ゼミノート 4.2 確率積分
Botter自主ゼミノート 4.2 確率積分 例題4.1
Botter自主ゼミノート 4.3 確率微分方程式
Botter自主ゼミノート 4.4 伊藤の確率微分演算
Botter自主ゼミノート 4.5 拡散過程
Botter自主ゼミノート 4.6 確率密度関数の時間進化 - コルモゴロフ方程式
Botter自主ゼミノート 6.1 動的システムの推定とは?
Botter自主ゼミノート 6.2 条件付き確率密度関数の時間進化
6.3 モーメント関数の時間進化
クスナー方程式の利用例
教科書では、続けてクスナー方程式の利用例を紹介しています。\hat{\varphi}(x)を状態変数x(t)に関して二階微分可能なスカラ関数として、
\hat{\varphi}(x_t) = \mathcal{E}\{\varphi(x_t) | \mathcal{Y}_t\} \tag{6.29}
によって定義される条件付き関数\hat{\varphi(x_t)}の時間進化d \hat{\varphi(x_t)}をクスナー方程式を使って計算します。
式(6.26)より、以下の式(6.30)を得ます。
\begin{aligned}
\hat{\varphi(x_t)} &= \int_{R^n} \varphi(x)(dp\{t,x|\mathcal{L}_t\}) dx \\
&= \int_{R^n} \varphi(x) [\mathcal{L}_x^* p \: dt + p[h(t,x) - \hat{h}(t,x)]^T (R_t R_t^T)^{-1} \{dy(t)-\hat{h}(t,x) dt\} dx \\
&= \int_{R^n} \varphi(x) \mathcal{L}_x^* p \: dt \: dx + \int_{R^n} p[h(t,x) - \varphi(x) \hat{h}(t,x)]^T (R_t R_t^T)^{-1} \{dy(t)-\hat{h}(t,x) dt\} dx \\
&= \left[\int_{R^n} \varphi(x) \mathcal{L}_x^* p \: dx \right]\:dt + \int_{R^n} \varphi(x) [h(t,x) - \hat{h}(t,x)]^T (R_t R_t^T)^{-1} \{dy(t)-\hat{h}(t,x) dt\} p \: dx\\
\end{aligned}
右辺第一項については、p\to0 (x_i \to \pm \infty)のもとで部分積分を実行することで
\begin{aligned}
\int_{R^n} \varphi(x) \mathcal{L}_x^* p \: dx &= \int_{R^n} \varphi(x)
\left[-\sum_i^n \frac{\partial}{\partial x_i}(p\:f_i) + \frac{1}{2}\sum_{i,j}^n \frac{\partial^2}{\partial x_i \partial x_j}(p[GQG^T]_{ij}])\right] dx \\
&= \int_{R^n} \sum_i^n \frac{\partial \varphi(x)}{\partial x_i} f_t(t, x) p \: dx + \frac{1}{2} \int_{R^n} \sum_{i,j}^n \frac{\partial^2 \varphi(x)}{\partial x_i \partial x_j} (GQG^T) p \: dx \\
&= \mathcal{E} \{\varphi_x^T(x) f(t,x) | \mathcal{Y}_t\} + \frac{1}{2} \:\text{tr} \: \mathcal{E}\{GQG^T \varphi_{xx}(x) | \mathcal{Y}_t\}\\
\end{aligned}
となり、第二項については
\int_{R^n} \varphi(x) [h(t,x) - \hat{h}(t,x)]^T (R_t R_t^T)^{-1} \{dy(t)-\hat{h}(t,x) dt\} p \: dx = \mathcal{E}\{\varphi(x)(h_t - \hat{h_t})^T | \mathcal{Y}_t\}(R_t R_t^T)^{-1}(dy_t - \hat{h_t} dt)
となるから、式(6.30)は以下の式(6.31)の通りとなります。
d\hat{\varphi}(x_t) = \left[\mathcal{E}\{\varphi_x^T f|\mathcal{Y}_t\} + \frac{1}{2} \: \text{tr} \: \mathcal{E}\{GQG^T\varphi_{xx}|\mathcal{Y}_t\} \right] dt + [\mathcal{E}\{\varphi h|\mathcal{Y}_t\} - \hat{\varphi}\hat{h}]^T(R_t R_t^T)^{-1}(dy_t - \hat{h_t} dt)
これがシステム状態量x(t)の各モーメントを求めるための基本の式となります。以下では、状態量の条件付平均値と共分散マトリクスを求めています。
まず、\varphi(x) = x_i (i=1,2,\cdots,n)とおくと、\hat{x}_i = \mathcal{E}\{x_i(t)|\mathcal{Y}_t\}に対して、以下の式*6.32)を得ます。
d\hat{x}_i = \hat{f}_i(t,x)dt + [ \mathcal{E}\{x_i(t)h(t,x)|\mathcal{Y}_t\} - \hat{x}_i \hat{h}(t,x)]^T \cdot \{R()R^T(t)\}^{-1}\{dy_t-\hat{h}(t,x)dt\} \tag{6.32}
つぎに、以下の式(6.33)に留意すると
P_t = \mathcal{E}\{(x_t - \hat{x}_t)(x_t - \hat{x}_t)|\mathcal{Y}_t\} = \mathcal{E}\{x_t x_t^T|\mathcal{Y}_t\} - \hat{x}_t \hat{x}_t^T
に留意すると、その確率微分は
dP_t = d\mathcal{E}\{x_t x_t^T | \mathcal{Y}_t\} - d(\hat{x}_t \hat{x}_t^T)
となる。ここで式(6.31)で\varphi(x) = x_i x_jとおくことで
d\mathcal{E}\{x_i(t)x_j(t)|\mathcal{Y}_t\} = \left[\mathcal{E}\{x_i f_j|\mathcal{Y}_t\} + \mathcal{E}\{x_i f_j|\mathcal{Y}_t\} + \mathcal{E}\{[GQG^T]_{ij}|\mathcal{Y}_t\}\right]dt + \left[\mathcal{E}\{x_ix_jh|\mathcal{Y}_t\} - \mathcal{E}\{x_ix_j|\mathcal{Y}_t\}\hat{h} \right]^T (R_t R_t^T)^{-1} \{dy_t - \hat{h}dt\}
また、式(6.32)を用いると
\begin{aligned}
d(\hat{x}_i \hat{x}_j) &= \hat{x}_i d\hat{x}_j + (d\hat{x}_i) \hat{x}_j + (d\hat{x}_i) (d\hat{x}_j)\\
&= \hat{x}_i d\hat{x}_j + (d\hat{x}_i) \hat{x}_j + [\mathcal{E}\{x_ih|\mathcal{Y}_t\} - \hat{x}_i \hat{h}\}]^T (R_tR_t^T)^{-1} [\mathcal{E}\{h x_j|\mathcal{Y}_t\} - \hat{h}\hat{x}_j]dt
\end{aligned}
となります。
したがってこれらより以下の式(6.34)を得ます。
(dP_t)_{ij} = \left\{
[\{\mathcal{E}\{x_if_j|\mathcal{Y}_t\}-\hat{x}_i\hat{f}_j]
+ [\mathcal{E}\{f_ix_j|\mathcal{Y}_t\} - \hat{f}_i\hat{x}_j]
+ \mathcal{E}\{[GQG^T]_{ij}|\mathcal{Y}_t\}
- [\mathcal{E}\{x_i h|\mathcal{Y}_t\} - \hat{x}_i \hat{h}]^T(R_t R_t^T)^{-1}[\mathcal{E}\{hx_j|\mathcal{Y}_t\} - \hat{h}\hat{x}_j]
\right\}dt
+ \left[ \mathcal{E}\{x_ix_jh|\mathcal{Y}_t\} - \mathcal{E}\{x_ix_j|\mathcal{Y}_t\}\hat{h} - \hat{x}_i \mathcal{E}\{x_jh|\mathcal{Y}_t\} - \hat{x}_j\mathcal{E}\{x_i h|\mathcal{Y}_t\} + 2\hat{x}_i\hat{x}_j\hat{h} \right]^T(R_t R_t^T)^{-1}\{dy_t-\hat{h} dt\}
式(6.32)と式(6.34)が\hat{x}(t|t)とP(t|t)のそれぞれの要素 \hat{x}_i(t|t), P_{ij}\:(i,j=1,2,\cdots,n)の時間進化の式となります。
Discussion