📔

Botter自主ゼミノート 1.2 確定システムの制御の回顧

2022/11/14に公開

仮想通貨

確率システム

tech

やること

https://www.amazon.co.jp/dp/4254209444
を読んで、確率微分方程式による最適化問題を解けるようになることです。

1.2 確定システムの制御の回顧

この節は、確率システムの制御の話をする前に、ノイズ項のない確定システムの制御についておさらいをしています。

システムおよび観測過程が，つぎのようにベクトル線形微分方程式で記述されるとする．
$\left. \begin{aligned} \.{x}(t) &= Ax(t) + Cu(t),\quad t_0 \le t \le T \\ y(t) &= Hx(t) \end{aligned} \quad \right\} \tag{1.1}$

観測過程の次元が $m < n$ (すなわち $H \ne I$ )ならばシステム状態量のすべてが独立に観測されるわけではないので，この場合には状態推定器としてオブザーバが必要となる．
システム状態量と同一次元を持つオブザーバ (full-order observer) は
$\left. \.{\^{x}}(t) = A \^{x}(t) + Cu(t) + K \left\{ y(t) - H \^{x}(t) \right\} \quad \right\} \tag{1.5}$
によって，また最小次元オブザーバを構成するのであれば
$\left. \begin{aligned} \^{x}(t) &= Dz(t) + Ey(t) \\ \.{z}(t) &= \^{A}(t) + \^{C}u(t) + Ky(t) \end{aligned} \quad \right\} \tag{1.6}$
によってシステム状態量 $x(t)$ の推定値 $\^{x}(t)$ が生成される。

オブザーバゲインマトリクス $K$ は推定誤差
$e(t) = x(t) - \^{x}(t)$
あるいは
$e(t) = x(t) = Mz(t)$
( $M$ は次元を揃えるためのマトリクス)が $e(t) \to 0 (t \to \infty)$ となるように定められるが，その決め方は一意的ではない．すなわち，(1.5)式のオブザーバについていえばマトリクス
$A - KH$
が安定であればよいわけで，その $n$ 個の固有値は設計者が任意に指定できる．(1.5)式では，オブザーバは $\{y(t) - H \^{x}(t)\}$ という項(修正項とも呼ぶ)を付加することによって構成されているが，これは歴史的に見てカルマンフィルタの構成をもとにして構成されているといえる (§6.8参照)．
オブザーバにより得られる推定値を用いると，最適制御量は
$u^o (t) = -N^-1 C^T \Pi(t) \^{x}(t) \quad \tag{1.7}$
によって与えられる．(1.3)式と(1.7)式を見比べると制御ゲインマトリクスは同じであり，ただ状態量をその推定値で置換しただけであることがわかる．

メモ

$n$ 次のリッカチ微分方程式がどういうものか分かりません。
リッカチ微分方程式とは何かという記事をいくつか読んでみました。教科書の1.4式とは形が違うような…。
- https://en.wikipedia.org/wiki/Algebraic_Riccati_equation
- https://www.jstage.jst.go.jp/article/sicejl1962/35/5/35_5_386/_pdf

その後調べてみると、こちらの記事がリッカチの微分方程式の導出を丁寧にやってくださっていました。最適制御の数理
ここの解説の助けを借りて導出を理解するのが私にはちょうどいい難易度かも

評価コスト汎関数 $J(u)$ というのは馴染みがないですが、制御量ベクトルu(t)に対して、第一項が最終時刻 $T$ における値の評価、第二項は時刻 $T$ に至るまでの $x(t)$ と $u(t)$ を評価しているように見えます

そういえば汎関数って何か良く分かってないなと思って調べたら、汎関数は関数の関数で、関数を変数として受け取って、スカラー値を返すのだそうです。

$F$ ， $M$ ， $N$ は結局何？

最適制御の数理では、これらのマトリクスは $t$ の関数になっていました。複雑！

二次形式とは、式の項がすべて二次のもののことのようです
- https://ja.wikipedia.org/wiki/二次形式

正定値解とは？
- $n \times n$ 実対象行列が正定値とは、 $n$ 個の実数を成分に持つ零ベクトルでない任意の列ベクトル $z$ に対して、二次形式 $z^T M z$ が必ず正となる行列のこと
- 微分方程式の一般解なり特殊解が正定値ってどういうこっちゃねん。

オブザーバのあたりは言いたいことは分かりますが、数式はよくわかりません

やること

1.2 確定システムの制御の回顧

メモ

Discussion