🤗

[統計学] ウッドベリーの公式の証明

2022/11/27に公開

先日の勉強会で学んだウッドベリーの公式の証明が簡潔でわかりやすかったため, 記述する

ウッドベリーの公式

(\mathbf{A}+\mathbf{CBC}^T)^{-1} = \mathbf{ A^{-1} -A^{-1}C(B^{-1}+C^TA^{-1}C)^{-1}C^TA^{-1} }\cdots(156)

証明

与式

\begin{align*} (\mathbf{A}+\mathbf{CBC}^T)^{-1} &= \mathbf{ A^{-1} -A^{-1}C(B^{-1}+C^TA^{-1}C)^{-1}C^TA^{-1} } \end{align*}

に対して両辺に(\mathbf{A}+\mathbf{CBC}^T) を左から掛ける

\begin{align*} (\text{左辺}) &= (\mathbf{A}+\mathbf{CBC}^T)(\mathbf{A}+\mathbf{CBC}^T)^{-1}\\ &= \mathbf{I}\\ \text{Where,}&\quad\text{I is identity matrix} \end{align*}

よって, 下記を示せばよい.

\begin{align*} (\text{右辺}) &= (\mathbf{A}+\mathbf{CBC}^T) (\mathbf{ A^{-1} -A^{-1}C(B^{-1}+C^TA^{-1}C)^{-1}C^TA^{-1} })\\ &= \mathbf{I} \cdots(1) \end{align*}

右辺を展開すると,

\begin{align*} (\text{右辺}) &= (\mathbf{A}+\mathbf{CBC}^T) (\mathbf{ A^{-1} -A^{-1}C(B^{-1}+C^TA^{-1}C)^{-1}C^TA^{-1} })\\ &= \mathbf{A} (\mathbf{ A^{-1} -A^{-1}C(B^{-1}+C^TA^{-1}C)^{-1}C^TA^{-1}}) + \mathbf{CBC}^T (\mathbf{ A^{-1} -A^{-1}C(B^{-1}+C^TA^{-1}C)^{-1}C^TA^{-1}}) \\ &= \mathbf{ I -C(B^{-1}+C^TA^{-1}C)^{-1}C^TA^{-1} + CBC^TA^{-1} -CBC^TA^{-1}C(B^{-1}+C^TA^{-1}C)^{-1}C^TA^{-1} } \end{align*}

上式より, (1)式を示すには下記を示せばよい

\begin{align*} \mathbf{ -C(B^{-1}+C^TA^{-1}C)^{-1}C^TA^{-1} + CBC^TA^{-1} -CBC^TA^{-1}C(B^{-1}+C^TA^{-1}C)^{-1}C^TA^{-1} } &= \mathbf{0} \\ \mathbf{ C(B^{-1}+C^TA^{-1}C)^{-1}C^TA^{-1} + CBC^TA^{-1}C(B^{-1}+C^TA^{-1}C)^{-1}C^TA^{-1} } &= \mathbf{ CBC^TA^{-1} } \\ \mathbf{ (B^{-1}+C^TA^{-1}C)^{-1} + BC^TA^{-1}C(B^{-1}+C^TA^{-1}C)^{-1} } &= \mathbf{ B } \\ \mathbf{ (I + BC^TA^{-1}C)(B^{-1}+C^TA^{-1}C)^{-1} } &= \mathbf{ B }\cdots (2) \end{align*}

ここで, (2)式の左辺は,

\begin{align*} \text{(左辺)} &= \mathbf{ (I - BB^{-1} + BB^{-1} + BC^TA^{-1}C)(B^{-1}+C^TA^{-1}C)^{-1} }\\ &= \mathbf{ (I - I + B[B^{-1}+ C^TA^{-1}C])(B^{-1}+C^TA^{-1}C)^{-1} }\\ &= \mathbf{ B[B^{-1}+ C^TA^{-1}C](B^{-1}+C^TA^{-1}C)^{-1} }\\ &= \mathbf{ B } \end{align*}

である. 従って, (2)が示された. 則ち, (1)式も成り立つので, 題意が示された.

解説

最後の変形の部分は複雑であるため補足する.

\begin{align*} \text{(左辺)} &= \mathbf{ (I - BB^{-1} + BB^{-1} + BC^TA^{-1}C)(B^{-1}+C^TA^{-1}C)^{-1} }\\ &= \mathbf{ (I - I + B[B^{-1}+ C^TA^{-1}C])(B^{-1}+C^TA^{-1}C)^{-1} }\\ &= \mathbf{ B[B^{-1}+ C^TA^{-1}C](B^{-1}+C^TA^{-1}C)^{-1} }\\ &= \mathbf{ B } \end{align*}

このうち一行目は左辺の\mathbf{(I-BB^{-1}+BB^{-1}+BC^TA^{-1}C)}-\mathbf{BB^{-1}}+\mathbf{BB^{-1}}(=\mathbf{0}) を加えている.

二行目は\mathbf{(I-BB^{-1}+B\cdot B^{-1}+B\cdot C^TA^{-1}C)}のように見ることで\mathbf{B}で括っている.

また, \mathbf{BB^{-1}} は単位行列なので書き直している. そうすると第一項と第二項が除去され, 三行目の式が現れる.

最後に\mathbf{(B^{-1}+C^TA^{-1}C)(B^{-1}+C^TA^{-1}C)^{-1}}は逆行列の定義より単位行列になるので, 左辺が\mathbf{B} となることが分かる.

Discussion