🗂

モデル予測制御入門 2：制約付きの非線形最適化問題

2023/07/02に公開

前章：モデル予測制御の考え方
MPCの本題に入る前に制約付きの非線形最適化問題を解く手法として主双対内点法を紹介いたします。

宣伝

拙著「PythonとCasADiで学ぶモデル予測制御 (KS理工学専門書) 」が発売されました！

是非こちらも読んでいただければ幸いです。

表記法について

ベクトル $x$ の各成分 $x^{(j)}$ を対角に並べて拡張した行列を $X \triangleq diag(x)$ 、
全成分が1のベクトルを $e \triangleq [1, 1, \dots]^T$ とします。

制約付き最適化問題の標準形

一般に、 $x \in \mathbb{R}^n$ 上での制約付きの最適化問題は以下の形で表せます。

x^* = \argmin_x f(x) \\ s.t. \left\{ \begin{align*} g_i(x) & = 0 ~~~~ i = 1,2,\dots \\ h_j(x) & \leq 0 ~~~~ j = 1,2,\dots \end{align*} \right. \tag{1}

ここで、補助変数として新たに $x^+, x^-,s \geq 0$ を導入して（ $s$ はスラック変数と呼ばれます）

x = x^+ - x^- \\ h_j(x) + s_j = 0

と置きます。ここで改めて $x \triangleq [s, x^-, x^+]$ と再定義して制約条件もまとめて $g=[g^{(1)}, g^{(2)}, \dots]^T$ と書き直すことで上記の問題は以下のように簡単な形式に帰着させられます。（ $n$ も新たな $x$ の次元として再定義します）

x^* = \argmin_x f(x) \\ s.t. \left\{ \begin{align*} g(x) & = 0 \\ x & \geq 0 \end{align*} \right. \tag{2}

バリア関数の導入

バリア関数法とは、 $x>0$ という不等式制約を無理やりコスト関数の方に押し付けてやる方法で、正の実数値パラメーター $\mu$ を用いて次のような問題に変形します。

x^* = \argmin_x \varphi_\mu(x) \\ \varphi_\mu(x) \triangleq f(x) - \mu \sum_{j=1}^n \log{(x^{(j)})} \\ s.t. ~~~~~ g(x) = 0 \tag{3}

最適化問題の解が存在する場合、上記のバリア問題(3)の解は $\mu \rightarrow 0$ でオリジナルの問題(2)の解と一致します。

ここでラグランジュ関数 $L=\varphi_\mu- \sum_i \lambda^{(i)} g^{(i)}$ の $x^{(j)}$ 微分は

\partial_j L = \partial_j f - \mu \frac{1}{x^{(j)}} - \sum_i \lambda^{(i)} \partial_j g^{(i)}

となるため、 $z^{(j)} \triangleq \mu / x^{(j)}$ とすると、ラグランジュの未定乗数法より解の条件は以下のようになります。

\begin{align*} \nabla f(x) + \lambda \nabla g(x) - z & = 0 \\ g(x) & = 0\\ XZe - \mu e & = 0 \tag{4} \end{align*}

この時、 $\mu \rightarrow 0$ とともに $x,z \geq 0$ が成立し、(2)のKKT条件と一致します。
この(4)の解を直線探索付きニュートン法を用いて求めます。

直線探索付きニュートン法によるバリア問題の解

直線探索付きニュートン法とは、例えばある関数 $F(x):\mathbb{R}^n \rightarrow \mathbb{R}$ を最小化するとき、すなわち $\nabla F(x) = 0$ を求めるときに次の方程式を解いて得られた方向ベクトル $d_k \in \mathbb{R}$

\nabla^2 F(x_k) d_k = -\nabla F(x_k) \tag{5}

を用いて、

x_{k+1} = x_k + \alpha_k d_k ~~~ (0 < \alpha_k \leq 1)

という形で反復的に $x_k$ を更新していく方法です。（ $\alpha_k \equiv 1$ と固定したものを単にニュートン法と呼ぶこともあります。）
$\alpha_k$ は各 $k$ ステップにおいてさらに探索され最適なものが選択されます。この時、方向ベクトル $d_k$ 上で $\alpha_k$ が探索されるため、「直線探索付き」という名前がついています。
この $\alpha_k$ を求める方法としてはフィルター法が良く使われています。

バリア問題の話に戻ると

\nabla F = \left( \begin{gathered} \nabla f(x_k) + \lambda_k \nabla g(x_k) - z_k\\ g(x_k) \\ X_k Z_k e - \mu e \end{gathered} \right) \tag{6}

を(5)に代入して

\begin{bmatrix} W_k & A_k & -I\\ A_k^T & 0 & 0 \\ Z_k & 0 & X_k \\ \end{bmatrix} \begin{pmatrix} d^x_k\\ d^\lambda_k\\ d^x_k\\ \end{pmatrix} = - \left( \begin{gathered} \nabla f(x_k) + A_k \lambda_k - z_k\\ g(x_k) \\ X_k Z_k e - \mu e \end{gathered} \right) \tag{7}

が得られます。ただし $A_k \triangleq \nabla g(x_k), ~~~ W_k \triangleq \nabla_{xx}^2 \mathcal{L}, ~~~ \mathcal{L} \triangleq f(x) + g(x)^T \lambda - z$ として与えました。

最適化ステップ

ここまでの準備で(1)の最適化を行うことが可能になりました。

初期値 $x_0, \lambda_0, z_0$ とバリアパラメータ $\mu>0$ を与える。
(7)を解いて方向 $d_k$ を決める。
フィルター法を用いて $\alpha_k$ を与える
$x_{k+1} = x_k + \alpha_k d^x_k, ~ \lambda_{k+1} = \lambda_k + \alpha_k d^\lambda_k,~ z_{k+1} = z_k + \alpha_k d^z_k$ で更新する。
$\mu$ を小さくする
2.に戻る

このステップを事前に決められた閾値を下回るまで繰り返すことで最適化を実行することが可能になります。

次の章では実際にMPCで簡単な制御を行ってみましょう。

次章：離散時間の非線形MPC