📔

Botter自主ゼミノート 1.2 確定システムの制御の回顧

2022/11/14に公開

やること

https://www.amazon.co.jp/dp/4254209444
を読んで、確率微分方程式による最適化問題を解けるようになることです。

1.2 確定システムの制御の回顧

この節は、確率システムの制御の話をする前に、ノイズ項のない確定システムの制御についておさらいをしています。

システムおよび観測過程が,つぎのようにベクトル線形微分方程式で記述されるとする.

\left. \begin{aligned} \.{x}(t) &= Ax(t) + Cu(t),\quad t_0 \le t \le T \\ y(t) &= Hx(t) \end{aligned} \quad \right\} \tag{1.1}

,>

観測過程の次元がm < n (すなわち H \ne I)ならばシステム状態量のすべてが独立に観測されるわけではないので,この場合には状態推定器としてオブザーバが必要となる.
システム状態量と同一次元を持つオブザーバ (full-order observer) は

\left. \.{\^{x}}(t) = A \^{x}(t) + Cu(t) + K \left\{ y(t) - H \^{x}(t) \right\} \quad \right\} \tag{1.5}

によって,また最小次元オブザーバを構成するのであれば

\left. \begin{aligned} \^{x}(t) &= Dz(t) + Ey(t) \\ \.{z}(t) &= \^{A}(t) + \^{C}u(t) + Ky(t) \end{aligned} \quad \right\} \tag{1.6}

によってシステム状態量x(t)の推定値\^{x}(t)が生成される。

オブザーバゲインマトリクスKは推定誤差

e(t) = x(t) - \^{x}(t)

あるいは

e(t) = x(t) = Mz(t)

(Mは次元を揃えるためのマトリクス)がe(t) \to 0 (t \to \infty)となるように定められるが,その決め方は一意的ではない.すなわち,(1.5)式のオブザーバについていえばマトリクス

A - KH

が安定であればよいわけで,そのn個の固有値は設計者が任意に指定できる.(1.5)式では,オブザーバは\{y(t) - H \^{x}(t)\}という項(修正項とも呼ぶ)を付加することによって構成されているが,これは歴史的に見てカルマンフィルタの構成をもとにして構成されているといえる (§6.8参照).
オブザーバにより得られる推定値を用いると,最適制御量は

u^o (t) = -N^-1 C^T \Pi(t) \^{x}(t) \quad \tag{1.7}

によって与えられる.(1.3)式と(1.7)式を見比べると制御ゲインマトリクスは同じであり,ただ状態量をその推定値で置換しただけであることがわかる.

メモ

  • その後調べてみると、こちらの記事がリッカチの微分方程式の導出を丁寧にやってくださっていました。最適制御の数理
  • ここの解説の助けを借りて導出を理解するのが私にはちょうどいい難易度かも

  • 評価コスト汎関数J(u)というのは馴染みがないですが、制御量ベクトルu(t)に対して、第一項が最終時刻Tにおける値の評価、第二項は時刻Tに至るまでのx(t)u(t)を評価しているように見えます
  • そういえば汎関数って何か良く分かってないなと思って調べたら、汎関数は関数の関数で、関数を変数として受け取って、スカラー値を返すのだそうです。

  • FMNは結局何?
  • 最適制御の数理では、これらのマトリクスはtの関数になっていました。複雑!


  • 正定値解とは?
    • n \times n実対象行列が正定値とは、n個の実数を成分に持つ零ベクトルでない任意の列ベクトルzに対して、二次形式z^T M zが必ず正となる行列のこと
    • 微分方程式の一般解なり特殊解が正定値ってどういうこっちゃねん。

  • オブザーバのあたりは言いたいことは分かりますが、数式はよくわかりません

Discussion