📚

統計のための行列代数第14章(14.14まで) 練習問題解答例

2022/10/29に公開

はじめに

統計のための行列代数練習問題解答例まとめを参照

第14章練習問題

1.

( $n$ 次元ベクトル $\mathbf{x}, \mathbf{y}$ に関する)対称な双線形形式 $\mathbf{x}^{\prime} \mathbf{A} \mathbf{y}$ は対応する二次形式, すなわち, 行列が $\mathbf{A}$ の二次形式を用いて表せることを示せ. それには

\mathbf{x}^{\prime} \mathbf{A} \mathbf{y}=(1 / 2)\left[(\mathbf{x}+\mathbf{y})^{\prime} \mathbf{A}(\mathbf{x}+\mathbf{y})-\mathbf{x}^{\prime} \mathbf{A} \mathbf{x}-\mathbf{y}^{\prime} \mathbf{A y}\right]

を証明せよ.

対称な双線形形式の定義： $\mathbf{x}^{\prime} \mathbf{A y}=\mathbf{y}^{\prime} \mathbf{A x}$ 、 $\mathbf{A}=\mathbf{A}^{\prime}$ を使うと以下の式展開ができる。

\begin{aligned} (1 / 2)\left[(\mathbf{x}+\mathbf{y})^{\prime} \mathbf{A}\right.&\left.(\mathbf{x}+\mathbf{y})-\mathbf{x}^{\prime} \mathbf{A x}-\mathbf{y}^{\prime} \mathbf{A} \mathbf{y}\right] \\ &=(1 / 2)\left(\mathbf{x}^{\prime} \mathbf{A x}+\mathbf{x}^{\prime} \mathbf{A y}+\mathbf{y}^{\prime} \mathbf{A x}+\mathbf{y}^{\prime} \mathbf{A} \mathbf{y}-\mathbf{x}^{\prime} \mathbf{A x}-\mathbf{y}^{\prime} \mathbf{A y}\right) \\ &=(1 / 2)\left(\mathbf{x}^{\prime} \mathbf{A} \mathbf{y}+\mathbf{y}^{\prime} \mathbf{A x}\right)=(1 / 2)\left(\mathbf{x}^{\prime} \mathbf{A} \mathbf{y}+\mathbf{x}^{\prime} \mathbf{A y}\right)=\mathbf{x}^{\prime} \mathbf{A y} \end{aligned}

2.

( $n$ 次元ベクトル $\mathbf{x}$ に関する) 任意の二次形式 $\mathbf{x}^{\prime} \mathbf{A} \mathbf{x}$ に対応して $\mathbf{x}^{\prime} \mathbf{A} \mathbf{x}$ と $\mathbf{x}^{\prime} \mathbf{B} \mathbf{x}$ が恒等的に等しいような一意な上三角行列 $\mathbf{B}$ が存在することを示せ. また $\mathbf{A}$ の要素を用いて $\mathbf{B}$ の要素を表せ.

$a_{ij}, b_{ij}$ をそれぞれ行列 $\mathbf{A}, \mathbf{B}$ の $ij$ 成分を表すとする $(i, j=1, \ldots, n)$ 。補助定理14.1.1から、 $j \neq i=1, \ldots, n$ に対して、 $a_{ii}=b_{ii}$ かつ $a_{ij}+a_{ji}=b_{ij}+b_{ji}$ のときかつそのときに限って $\mathbf{x}^{\prime} \mathbf{A} \mathbf{x}$ と $\mathbf{x}^{\prime} \mathbf{B} \mathbf{x}$ が恒等的に等しいことが示されている。

この補助定理に従えば、 $b_{ji} = 0 (j>i=1, \ldots, n)$ とすることで、 $a_{ii}=b_{ii}$ かつ $a_{ij}+a_{ji}=b_{ij}$ となるような行列 $\mathbf{B}$ を作ることも可能であり、かつ一意に定まる。そしてこの場合に限って行列 $\mathbf{B}$ は上三角行列となるので、題意が示される。

補助定理 14.1.1. $\mathbf{A}=\left\{a_{ij}\right\}, \mathbf{B}=\left\{b_{ij}\right\}$ を任意の $n \times n$ 行列とする. $(\mathbf{x}$ に関する)2つの二次形式 $\mathbf{x}^{\prime} \mathbf{A} \mathbf{x}, \mathbf{x}^{\prime} \mathbf{B x}$ は, $j \neq i=1, \ldots, n$ に対して, $a_{ii}=b_{ii}$ かつ $a_{ij}+a_{ji}=b_{ij}+b_{ji}$ のときかつそのときに限って, すなわち, $\mathbf{A}+\mathbf{A}^{\prime}=\mathbf{B}+\mathbf{B}^{\prime}$ のときかつそのときに限って, 恒等的に等しい.

3.

2つの半正定値行列の和が正定値となる例を挙げよ.

2つの $2 \times 2$ 行列 $\begin{pmatrix}1 & 0 \\ 0 & 0\end{pmatrix}$ と $\begin{pmatrix}0 & 0 \\ 0 & 1\end{pmatrix}$ を考える。
それぞれの行列は（対角行列の対角成分が $0$ または $1$ なので、補助定理14.2.1により）半正定値行列であるが、その和 $\begin{pmatrix}1 & 0 \\ 0 & 1\end{pmatrix}$ は正定値である。

補助定理14.2.1. $\mathbf{D}=\left\{d_i\right\}$ を $n \times n$ 対角行列とする. このとき, $(1)\ d_1, \ldots, d_n$ が非負値のときかつそのときに限って, $\mathbf{D}$ は非負定値である. $(2)\ d_1, \ldots, d_n$ が正のときかつそのときに限って, $\mathbf{D}$ は正定値である. $(3)\ i=1, \ldots, n$ に対して $d_i \geq 0$ であり $i$ の少なくとも1個の値に対して等号が成り立つときかつそのときに限って, $\mathbf{D}$ は半正定値である.

4.

(非対称で)非特異な半正定値行列が存在することを例を挙げて示せ.

あらゆる $\mathbf{x} \in \mathcal{R}^n$ に対して $\mathbf{x}^{\prime} \mathbf{A} \mathbf{x}\geq0$ で, ある $x \neq 0$ に対して $\mathbf{x}^{\prime}\mathbf{A x}=0$ の時 $\mathbf{A}$ は半正定値である.

系8.5.6 三角行列はその対角要素がいずれも $0$ でないときかつその時に限って、非特異である。

以下の $n\times n$ 上三角行列を考える

\mathbf{A}=\begin{pmatrix} 1 & 2 & 0 & \ldots & 0 \\ 0 & 1 & 0 & \ldots & 0 \\ 0 & 0 & 1 & \ldots & 0 \\ \vdots & \vdots & & \ddots & \\ 0 & 0 & 0 & & 1 \end{pmatrix}

任意の $n$ 次元ベクトル $\mathbf{x}=\left(x_1, x_2, x_3, \ldots, x_n\right)^{\prime}$ に対して以下が成り立つ。

\mathbf{x}^{\prime} \mathbf{A} \mathbf{x}=\left(x_1+x_2\right)^2+x_3^2+\cdots+x_n^2 \geq 0

もし、 $x_1=-x_2$ 、 $x_3=\cdots=x_n=0$ の場合 $\mathbf{x}^{\prime} \mathbf{A x}=0$ となる。

よって、 $\mathbf{A}$ は半正定値となる。また、系8.5.6より $\mathbf{A}$ は非特異である。

5.

$\mathbf{P}^{\prime}\mathbf{AP}$ が正定値となるような $n \times n$ 半正定値行列 $\mathbf{A}$ と $n \times m$ 行列 $\mathbf{P}$ が存在することを例を挙げて示せ(ここで $m \lt n$ とする) .

$\mathbf{A} = \begin{pmatrix}\mathbf{I}_{m} & \mathbf{0} \\ \mathbf{0} & \mathbf{0}\end{pmatrix}$ で表される $n\times n$ 行列 $(m \lt n)$ を考える。これは明らかに半正定値行列となる。そして $\mathbf{P}$ を $\begin{pmatrix}\mathbf{I}_{m} \\ \mathbf{0}\end{pmatrix}$ のような $n\times m$ 行列とする。これについて $\mathbf{P}^{\prime}\mathbf{AP}$ を計算すると

\begin{aligned} \mathbf{P}^{\prime}\mathbf{AP} &= \begin{pmatrix}\mathbf{I}_{m} ,\mathbf{0}\end{pmatrix} \begin{pmatrix}\mathbf{I}_{m} & \mathbf{0} \\ \mathbf{0} & \mathbf{0}\end{pmatrix} \begin{pmatrix}\mathbf{I}_{m} \\ \mathbf{0}\end{pmatrix} \\ &= \begin{pmatrix}\mathbf{I}_{m} ,\mathbf{0}\end{pmatrix}\begin{pmatrix}\mathbf{I}_{m} \\ \mathbf{0}\end{pmatrix} \\ &= \mathbf{I}_{m} \end{aligned}

これは明らかに $m\times m$ の正定値行列である。

6.

非負定値(正定値あるいは半正定値)行列に対する定理14.2.9 の結果(1)一(3) を非正定値行列に対する同値な結果に変えよ.

定理14.2.9
$\mathbf{A}$ を $n\times n$ 行列、 $\mathbf{P}$ を $n\times m$ 行列とする。
(1)もし $\mathbf{A}$ が非負定値ならば、 $\mathbf{P}'\mathbf{A}\mathbf{P}$ も非負定値である。
(2)もし $\mathbf{A}$ が非負定値でかつ $\operatorname{rank}(\mathbf{P})<m$ ならば、 $\mathbf{P}'\mathbf{A}\mathbf{P}$ は半正定値である。
(3)もし $\mathbf{A}$ が正定値でかつ $\operatorname{rank}(\mathbf{P})=m$ ならば、 $\mathbf{P}'\mathbf{A}\mathbf{P}$ も正定値である。

上記の定理14.2.9の結果における $\mathbf{A}$ を $-\mathbf{A}$ に置き換えることで、非正定値に対する結果を得る：
(1)もし $-\mathbf{A}$ が非負定値ならば、 $-\mathbf{P}'\mathbf{A}\mathbf{P}$ も非負定値である。
(2)もし $-\mathbf{A}$ が非負定値でかつ $\operatorname{rank}(\mathbf{P})<m$ ならば、 $-\mathbf{P}'\mathbf{A}\mathbf{P}$ は半正定値である。
(3)もし $-\mathbf{A}$ が正定値でかつ $\operatorname{rank}(\mathbf{P})=m$ ならば、 $-\mathbf{P}'\mathbf{A}\mathbf{P}$ も正定値である。

これを言い換えると以下の結果を得る：
(1)もし $\mathbf{A}$ が非正定値ならば、 $\mathbf{P}'\mathbf{A}\mathbf{P}$ も非正定値である。
(2)もし $\mathbf{A}$ が非正定値でかつ $\operatorname{rank}(\mathbf{P})<m$ ならば、 $\mathbf{P}'\mathbf{A}\mathbf{P}$ は半負定値である。
(3)もし $\mathbf{A}$ が負定値でかつ $\operatorname{rank}(\mathbf{P})=m$ ならば、 $\mathbf{P}'\mathbf{A}\mathbf{P}$ も負定値である。

7.

$\left\{\mathbf{X}_1, \ldots, \mathbf{X}_r\right\}$ を線形空間 $\mathcal{V}$ からの行列の集合, $\mathbf{A}=\left\{a_{i j}\right\}$ を第 $ij$ 要素が $\mathbf{X}_i \cdot \mathbf{X}_j$ の $r \times r$ 行列とする―この行列を集合 $\left\{\mathbf{X}_1, \ldots, \mathbf{X}_r\right\}$ のグラムの行列(Gram matrix) (あるいはグラミアン (Gramian) と呼び, その行列式を $\left\{\mathbf{X}_1, \ldots, \mathbf{X}_r\right\}$ のグラミアン (Gramian) あるいはグラムの行列式 (Gram determinant) と呼ぶ.

$\mathbf{(a)}$ $\mathbf{A}$ が対称で非負定値であることを示せ.
$\mathbf{(b)}$ $\mathbf{A}$ が非特異のときかつそのときに限って， $\mathbf{X}_1, \ldots, \mathbf{X}_r$ が線形独立であることを示せ.

$\mathbf{(a)}$ $\mathbf{Y}_1, \dots , \mathbf{Y}_n$ は $\mathcal{V}$ の正規直交基底を形成する任意の行列であるとする。 $1,\ldots,r$ に対して，以下を満たすようなスカラー $b_{1j}, \ldots , b_{nj}$ が存在するとする．

\mathbf{X}_j=b_{1 j} \mathbf{Y}_1+\cdots+b_{n j} \mathbf{Y}_n .

このとき、 $i,j =1,\ldots ,r$ に対して

\begin{aligned} a_{i j}=\mathbf{X}_i \cdot \mathbf{X}_j &=\left(\sum_{k=1}^n b_{k i} \mathbf{Y}_k\right) \cdot\left(\sum_{s=1}^n b_{s j} \mathbf{Y}_s\right) \\ &=\sum_{k=1}^n b_{k i}\left[\mathbf{Y}_k \cdot\left(\sum_{s=1}^n b_{s j} \mathbf{Y}_s\right)\right] \\ &=\sum_{k=1}^n b_{k i} \sum_{s=1}^n b_{s j}\left(\mathbf{Y}_s \cdot \mathbf{Y}_k\right) \\ &=\sum_{k=1}^n b_{k i} b_{k j} \end{aligned}

である．このとき, $\sum_{k=1}^n b_{k i} b_{k j}$ は $r \times r$ 行列 $\mathbf{B}^{\prime} \mathbf{B}$ の $ij$ 成分である．ここで行列 $\mathbf{B}$ は $k j$ 成分が $b_{k j}$ の $n \times r$ 行列である． (したがって転置行列の $\mathbf{B}^{\prime}$ は $i k$ 成分が $b_{k i}$ の $r \times n$ 行列である ). これらから, $\mathbf{A}=\mathbf{B}^{\prime} \mathbf{B}$ , であり $\mathbf{B}^{\prime} \mathbf{B}$ 対称で非負定値行列(系14.2.14より)であるから(a)が示された．

系14.2.14. $\mathbf{P}$ を任意の $n \times m$ 行列とする. $m \times m$ 行列 $\mathbf{P}^{\prime} \mathbf{P}$ は非負定値である. もし $\operatorname{rank}(\mathbf{P})=m$ ならば, $\mathbf{P}^{\prime} \mathbf{P}$ は正定値であり, そうでなければ（もし $\operatorname{rank}(\mathbf{P})<m$ ならば), $\mathbf{P}^{\prime} \mathbf{P}$ は半正定値である.

$\mathbf{(b)}$

次に $j=1, \ldots, r$ , に対して $\mathbf{b}_j=\left(b_{1 j}, \ldots, b_{n j}\right)^{\prime}$ が存在するとする．このとき $\mathbf{Y}_1, \ldots, \mathbf{Y}_n$ は線型独立であるため(直交基底であると仮定しているため), 定理 3.2.4 に照らして $\mathbf{X}_1, \ldots, \mathbf{X}_r$ は $\mathbf{b}_1, \ldots, \mathbf{b}_r$ が線型独立であるときに限り，かつそのときに限って線型独立である. したがって $\mathbf{b}_1, \ldots, \mathbf{b}_r$ は $\mathbf{B}$ の列ベクトルであるため, $\mathbf{X}_1, \ldots, \mathbf{X}_r$ は $\operatorname{rank}(\mathbf{B})=r$ あるいは同値な表現として系7.4.5を用いて $\operatorname{rank}\left(\mathbf{B}^{\prime} \mathbf{B}\right)=r$ . が成り立つときにかつそのときに限って線形独立である．また $\mathbf{A}=\mathbf{B}^{\prime} \mathbf{B}$ であるため $\mathbf{X}_1, \ldots, \mathbf{X}_r$ は $\mathbf{A}$ が非特異のときかつそのときに限って線型独立であることがわかる．

8.

$\mathbf{A} = \{a_{ij} \}$ を $n \times n$ 対称、正定値行列 $\mathbf{B} = \{b_{ij}\} = \mathbf{A}^{-1}$ とする. $i = 1,\ldots, n$ に対して

b_{ii} \ge 1/a_{ii}

であり，等号はすべての $j\neq i$ に対して $a_{ij} = 0$ のときかつそのときに限って成り立つことを示せ.

解

9.

$\mathbf{A}$ を $m \times n$ 行列， $\mathbf{D}$ を最大列階数の適当な行列 $\mathbf{P}$ と最大行階数の適当な行列 $\mathbf{Q}$ に対して $\mathbf{A} = \mathbf{PDQ}$ と表される対角行列とする. $\operatorname{rank}(\mathbf{A})$ が $\mathbf{D}$ の中の $0$ でない対角要素の数に等しいことを示して補助定理14.3.1の結果を拡張せよ.

補助定理 14.3.1. $\mathbf{A}$ を $n \times n$ 行列, $\mathbf{D}$ を適当な $n \times n$ 非特異行列 $\mathbf{P}, \mathbf{Q}$ に対して $\mathbf{A}=\mathbf{P D Q}$ と表される $n \times n$ 対角行列とする. このとき, $\operatorname{rank}(\mathbf{A})$ は $\mathbf{D}$ の中の $0$ でない対角要素の数に等しい.

補助定理 8.3.2. $\mathbf{A}$ を $m \times n$ 行列， $B$ を $n \times p$ 行列とする.もし $\mathbf{A}$ が最大列階数をもつならば，
$\mathcal{R}(\mathbf{AB}) =\mathcal{R}(\mathbf{B}),\quad \operatorname{rank}(\mathbf{AB}) = \operatorname{rank}(\mathbf{B})$ である.同様に，もし $\mathbf{B}$ が最大行階数をもつならば， $\mathcal{C}(\mathbf{AB}) =\mathcal{C}(\mathbf{A}), \quad \operatorname{rank}(\mathbf{AB}) = \operatorname{rank}(\mathbf{A})$ である.

補助定理8.3.2より、

\operatorname{rank}(\mathbf{A}) = \operatorname{rank}(\mathbf{P}\mathbf{D}\mathbf{Q}) = \operatorname{rank}(\mathbf{D}\mathbf{Q}) = \operatorname{rank}(\mathbf{D})

が成り立つ。今 $\mathbf{D}$ は対角行列なので、その階数は $0$ でない対角要素の数に等しい。

10.

$\mathbf{A}$ を $n \times n$ 対称冪等行列， $\mathbf{V}$ を対称正定値行列とする. $\operatorname{rank}(\mathbf{AVA}) = \operatorname{tr}(\mathbf{A})$ を示せ.

定理14.3.13より、ある非特異行列 $\mathbf{P}$ に対して、 $\mathbf{V}=\mathbf{P}^{\prime} \mathbf{P}$ となる。
従って、系7.4.5・系8.3.3・系10.2.2を用いて次が示される。

\operatorname{rank}(\mathbf{A V A})=\operatorname{rank}\left[(\mathbf{P A})^{\prime} \mathbf{P A}\right]=\operatorname{rank}(\mathbf{P A})=\operatorname{rank}(\mathbf{A})=\operatorname{tr}(\mathbf{A}).

系14.3.13. $n \times n$ 行列 $\mathbf{A}$ は、 $\mathbf{A}=\mathbf{P}^{\prime} \mathbf{P}$ を満たす非特異行列 $\mathbf{P}$ が存在するときかつそのときに限って、対称正定値行列である。

系7.4.5. 任意の行列 $\mathbf{A}$ に対して、
$\mathcal{C}\left(\mathbf{A}^{\prime} \mathbf{A}\right)=\mathcal{C}\left(\mathbf{A}^{\prime}\right), \mathcal{R}\left(\mathbf{A}^{\prime} \mathbf{A}\right)=\mathcal{R}(\mathbf{A})$ , $\operatorname{rank}\left(\mathbf{A}^{\prime} \mathbf{A}\right)=\operatorname{rank}(\mathbf{A})$
が成り立つ。

系8.3.3. もし $\mathbf{A}$ が $n \times n$ 非特異行列ならば、任意の $n \times p$ 行列 $\mathbf{B}$ に対して、
$\mathcal{R}(\mathbf{A B})=\mathcal{R}(\mathbf{B}), \quad \operatorname{rank}(\mathbf{A B})=\operatorname{rank}(\mathbf{B})$ である。同様に、もし $\mathbf{B}$ が $n \times n$ 非特異行列ならば、任意の $m \times n$ 行列 $\mathbf{A}$ に対して、 $\mathcal{C}(\mathbf{A B})=\mathcal{C}(\mathbf{A}), \quad \operatorname{rank}(\mathbf{A B})=\operatorname{rank}(\mathbf{A})$ である。

系10.2.2. 任意の冪等行列 $A$ に対して、
$\operatorname{rank}(\mathbf{A})=\operatorname{tr}(\mathbf{A})$ である。

11.

もし $n \times n$ 行列 $\mathbf{A}$ があらゆる $n$ 次元列ベクトル $\mathbf{x} \neq \mathbf{0}$ に対して $\mathbf{x}^{\prime} \mathbf{A x} \neq 0$ を満たせば, $\mathbf{A}$ は正定値か負定値かのどちらかであることを示せ.

対称行列 $\mathbf{B}$ を $\mathbf{B}=(1 / 2)\left(\mathbf{A}+\mathbf{A}^{\prime}\right)$ で定めると任意の $\mathbf{x}$ に対して $\mathbf{x}^{\prime} \mathbf{B x}=\mathbf{x}^{\prime} \mathbf{A x}$ が成り立つ。 $\mathbf{B}$ は対称なので系14.3.5より $\mathbf{B}=$ $\mathbf{P}^{\prime} \mathbf{D P}$ を満たす非特異行列 $\mathbf{P}$ と対角行列 $\mathbf{D}=\operatorname{diag}\left(d_1, \ldots, d_n\right)$ が存在する。
よって、任意の $\mathbf{x}$ に対して $\mathbf{x}^{\prime} \mathbf{A x} = \mathbf{x}^{\prime} \mathbf{B x} = (\mathbf{P x})^{\prime} \mathbf{D P x} \neq 0$ が成り立つ。

ここで、もし $d_i=0$ なる $i$ が存在したとすると、 $\mathbf{P x} = \mathbf{e}_i$ ( $\mathbf{e}_i$ は第 $i$ 成分のみ $1$ で他が $0$ のベクトル) を満たす $\mathbf{x}$ をとれば

(\mathbf{P x})^{\prime} \mathbf{D P x}=\mathbf{e}_i^{\prime} \mathbf{D e}_i=d_i=0

となり矛盾するので、全ての $i$ に対して $d_i \neq 0$ である。

さらに、もし $d_i\gt 0$ かつ $d_j<0$ であるような $i, j$ が存在したとすると、 $\mathbf{P x} = \mathbf{y}$ (ただし $\mathbf{y}$ は第 $i$ 成分が $1 / \sqrt{d_i}$ で第 $j$ 成分が $1 / \sqrt{-d_j}$ であるベクトル) を満たす $\mathbf{x}$ をとれば

(\mathbf{P x})^{\prime} \mathbf{D} \mathbf{P x}=\mathbf{y}^{\prime} \mathbf{D y}=d_i (1 / \sqrt{d_i})^2 + d_j (1 / \sqrt{-d_j})^2 = 1 - 1 =0

となり矛盾するので、全ての $i$ に対して $d_i \gt 0$ であるか、または全ての $i$ に対して $d_i < 0$ である。系14.2.15より、前者の場合 $\mathbf{B}$ は正定値であり、後者の場合 $\mathbf{B}$ は負定値である。 $\mathbf{A}$ についても同様である。

系14.2.15. $\mathbf{P}$ を $n \times n$ 非特異行列, $\mathbf{D}=\left\{d_i\right\}$ を $n \times n$ 対角行列とする. このとき, (1) $d_1, \ldots, d_n$ が非負のときかつそのときに限って, $\mathbf{P}^{\prime} \mathbf{DP}$ は非負定値である. (2) $d_1, \ldots, d_n$ が正のときかつそのときに限って, $\mathbf{P}^{\prime} \mathbf{DP}$ は正定値である. (3) $i=1, \ldots, n$ に対して $d_i \geq 0$ であり, $i$ の少なくとも 1つの値に対して等号が成り立つときかつそのときに限って, $\mathbf{P}^{\prime} \mathbf{DP}$ は半正定値である.

12.

$\mathbf{(a)}$ $\mathbf{A}$ を階数 $r$ の $n \times n$ 対称行列とする. $\mathbf{P}$ を $n \times n$ 非特異行列, $\mathbf{D}$ を $n \times n$ 対角行列で $\mathbf{A}=\mathbf{P}^{\prime} \mathbf{D P}$ を満たすものとする―この行列の存在は系14.3.5によって保証されている. $\mathbf{D}$ の対角要素のうち正のものの個数 $m$ を $\mathbf{A}$ の(あるいは行列 $\mathbf{A}$ による二次形式 $\mathbf{x}^{\prime} \mathbf{Ax}$ の) 慣性指数 (index of inertia) と呼ぶ.この慣性指数は, $m$ が $\mathbf{P}$ や $\mathbf{D}$ のとり方によらないという意味において明確に定義されることを示せ。すなわち，もし $\mathbf{P}_1, \mathbf{P}_2$ が非特異行列で $\mathbf{D}_1, \mathbf{D}_2$ が $\mathbf{A}=\mathbf{P}_1^{\prime}\mathbf{D}_1 \mathbf{P}_1=\mathbf{P}_2^{\prime} \mathbf{D}_2 \mathbf{P}_2$ を満たす対角行列ならば, $\mathbf{D}_1$ , $\mathbf{D}_2$ は同じ個数の正の対角要素をもつことを示せ.また $\mathbf{D}$ の対角要素のうち負のものの個数が $r-m$ であることを示せ。

$\mathbf{(b)}$ $\mathbf{A}$ を $n \times n$ 対称行列とする. ある $n \times n$ 非特異行列 $\mathbf{P}$ とある非負の整数 $m$ , $r$ に対して $\mathbf{A}=\mathbf{P}^{\prime} \operatorname{diag}\left(\mathbf{I}_m,-\mathbf{I}_{r-m}, \mathbf{0}\right) \mathbf{P}$ であることを示せ. 更に, $m$ が行列 $\mathbf{A}$ の慣性指数に等しく $r=\operatorname{rank}(\mathbf{A})$ であることを示せ.

$\mathbf{(c)}$ $n \times n$ 対称行列 $\mathbf{A}, \mathbf{B}$ について, $\mathbf{B}=\mathbf{P}^{\prime} \mathbf{A} \mathbf{P}$ を満たす $n \times n$ 非特異行列 $\mathbf{P}$ が存在するとき, $\mathbf{BA}$ に合同 (congruent) であると言う. (もし $\mathbf{B}$ が $\mathbf{A}$ に合同ならば, 明らかに $\mathbf{A}$ は $\mathbf{B}$ に合同である.) $\mathbf{B}$ が $\mathbf{A}$ と同じ階数と同じ慣性指数をもつときかつそのときに限って, $\mathbf{B}$ が $\mathbf{A}$ に合同であることを示せ. この結果を, James Joseph Sylvester (1814-1897) にちなんでシルヴェスターの慣性法則 (Sylvester's law of inertia) と呼ぶ.

$\mathbf{(d)}$ $\mathbf{A}$ を慣性指数 $m$ をもつ階数 $r$ の $n \times n$ 対称行列とする. $\mathbf{A}$ は $m=r$ のときかつそのときに限って，非負定値であり， $m=r=n$ ときかつそのときに限って, 正定値であることを示せ。

$\mathbf{(a)}$ $\mathbf{P}_1$ , $\mathbf{P}_2$ を非特異行列, $\mathbf{D}_1=\left\{d_i^{(1)}\right\}$ , $\mathbf{D}_2=\left\{d_i^{(2)}\right\}$ を $\mathbf{A}=\mathbf{P}_1^{\prime} \mathbf{D}_1 \mathbf{P}_1=\mathbf{P}_2^{\prime} \mathbf{D}_2 \mathbf{P}_2$ を満たす $n \times n$ の対角行列とする. $m_1$ , $m_2$ をそれぞれ $\mathbf{D}_1$ , $\mathbf{D}_2$ の対角成分のうち正のものの個数とする.
$i_1, i_2, \ldots, i_n$ を $d_{i_j}^{(1)}\gt 0$ for $j=$ $1,2, \ldots, m_1$ ,となるような置換とする. 同様に $k_1, k_2, \ldots, k_n$ を $d_{k_j}^{(2)}\gt 0$ for $j=1,2, \ldots, m_2$ となりような置換とする.
$\mathbf{U}_1$ を $1, 2, \ldots, n$ 列がそれぞれ $\mathbf{I}_n$ の $i_1$ , $i_2$ , $\ldots, i_n$ 列になるような $n \times n$ の置換行列, $\mathbf{U}_2$ を $1,2,\ldots, n$ 列が $\mathbf{I}_n$ の $k_1$ , $k_2$ , $\ldots, k_n$ 列になっている $n \times n$ の置換行列, $\mathbf{D}_1^*$ , $\mathbf{D}_2^*$ を $\mathbf{D}_1^*=$ $\mathbf{U}_1^{\prime} \mathbf{D}_1 \mathbf{U}_1$ と $\mathbf{D}_2^*=\mathbf{U}_2^{\prime} \mathbf{D}_2 \mathbf{U}_2$ のように定義する.
すると, $\mathbf{D}_1^*=\operatorname{diag}\left(d_{i_1}^{(1)}, d_{i_2}^{(1)}, \ldots, d_{i_n}^{(1)}\right)$ で $\mathbf{D}_2^*=$ $\operatorname{diag}\left(d_{k_1}^{(2)}, d_{k_2}^{(2)}, \ldots, d_{k_n}^{(2)}\right)$

$m_1<m_2$ を仮定して矛盾を導く(同様に $m_1\gt m_2$ も導く)

\begin{aligned} \mathbf{D}_2^*=\mathbf{U}_2^{\prime}\left(\mathbf{P}_2^{-1}\right)^{\prime} \mathbf{A} \mathbf{P}_2^{-1} \mathbf{U}_2 &=\mathbf{U}_2^{\prime}\left(\mathbf{P}_2^{-1}\right)^{\prime} \mathbf{P}_1^{\prime} \mathbf{D}_1 \mathbf{P}_1 \mathbf{P}_2^{-1} \mathbf{U}_2 \\ &=\mathbf{U}_2^{\prime}\left(\mathbf{P}_2^{-1}\right)^{\prime} \mathbf{P}_1^{\prime} \mathbf{U}_1 \mathbf{D}_1^* \mathbf{U}_1^{\prime} \mathbf{P}_1 \mathbf{P}_2^{-1} \mathbf{U}_2=\mathbf{R}^{\prime} \mathbf{D}_1^* \mathbf{R} \end{aligned}

$\mathbf{R}=\mathbf{U}_1^{\prime} \mathbf{P}_1 \mathbf{P}_2^{-1} \mathbf{U}_2$ . $n \times n$ 行列 $\mathbf{R}$ を次のように分割する： $\mathbf{R}=\left(\begin{array}{ll}\mathbf{R}_{11} & \mathbf{R}_{12} \\ \mathbf{R}_{21} & \mathbf{R}_{22}\end{array}\right)$ , $\mathbf{R}_{11}$ は $m_1 \times m_2$ 行列.

$\mathbf{x}=\left\{x_j\right\}$ を $\mathbf{R}_{11} \mathbf{x}=$ $\mathbf{0}$ を満たすような $m_2$ -次元の非ゼロベクトルとすると, 仮定した $m_1<m_2$ から, そのようなベクトル $\mathbf{x}$ が存在する. $y_1, y_2, \ldots, y_{n-m_1}$ ,をベクトル $\mathbf{R}_{21} \mathbf{x}$ の要素として導入すると,

\begin{aligned} \sum_{j=1}^{m_2} d_{k_j}^{(2)} x_j^2=\left(\begin{array}{c} \mathbf{x} \\ \mathbf{0} \end{array}\right)^{\prime} \mathbf{D}_2^*\left(\begin{array}{l} \mathbf{x} \\ \mathbf{0} \end{array}\right) &=\left(\begin{array}{l} \mathbf{x} \\ \mathbf{0} \end{array}\right)^{\prime} \mathbf{R}^{\prime} \mathbf{D}_1^* \mathbf{R}\left(\begin{array}{l} \mathbf{x} \\ \mathbf{0} \end{array}\right) \\ &=\left(\begin{array}{c} \mathbf{0} \\ \mathbf{R}_{21} \mathbf{x} \end{array}\right)^{\prime} \mathbf{D}_1^*\left(\begin{array}{c} \mathbf{0} \\ \mathbf{R}_{21} \mathbf{x} \end{array}\right) \\ &=\sum_{j=m_1+1}^n d_{i_j}^{(1)} y_{j-m_1}^2 \end{aligned}

さらに,

\sum_{j=1}^{m_2} d_{k_j}^{(2)} x_j^2\gt 0,

ここで $\mathbf{D}_1^*$ の $n-m_1$ 個の対角成分がゼロまたは負なので,

\sum_{j=m_1+1}^{n} d_{i_j}^{(1)} y_{j-m_1}^2 \leq 0,

ここに連なる3つの等式・不等式は互いに矛盾するため, $m_1<m_2$ という仮定は偽である.
よって $m_1 \geq m_2$

同等の議論を $m_1\gt m_2$ に対しても適用して, $m_1 \leq m_2$ が言える. これと $m_1 \geq m_2$ を組み合わせて, $m_2=m_1$ .

補助定理14.3.1から, $\mathbf{D}$ の非ゼロ対角成分の数は $r$ . $\mathbf{D}$ の負の対角成分は $r-m$ .

補助定理 14.3.1. $\mathbf{A}$ を $n \times n$ 行列, $\mathbf{D}$ を適当な $n \times n$ 非特異行列 $\mathbf{P}, \mathbf{Q}$ に対して $\mathbf{A}=\mathbf{P D Q}$ と表される $n \times n$ 対角行列とする. このとき, $\operatorname{rank}(\mathbf{A})$ は $\mathbf{D}$ の中の $0$ でない対角要素の数に等しい.

$\mathbf{(b)}$ 系14.3.5から, $n \times n$ 非特異行列 $\mathbf{P}_*$ と $n \times n$ 対角行列 $\mathbf{D}=\left\{d_i\right\}$ に対して, $\mathbf{A}=\mathbf{P}_*^{\prime} \mathbf{D} \mathbf{P}_*$ となるものが存在する.

系14.3.5. 任意の $n\times n$ 対称行列 $\mathbf{A}$ に対応して， $\mathbf{A} = \mathbf{P}^{\prime}\mathbf{DP}$ となる非特異行列 $\mathbf{P}$ と対角行列 $\mathbf{D}$ が存在する.

$i_1, i_2, \ldots, i_n$ を $n$ までの自然数の置換： $j=1, \ldots, m$ に対して $d_{i j}\gt 0$ , $j=m+1, \ldots, r$ に対して $d_{i_j}<0$ , $j=r+1, \ldots, n$ に対して $d_{i_j}=0$ . $\mathbf{U}$ を $n \times n$ の置換行列で, $1,2, \ldots ,n$ th 列が $\mathbf{I}_n$ の $i_1$ th, $i_2$ th, $\ldots, i_n$ th 列になるものとして, $\mathbf{D}_*=\mathbf{U}^{\prime} \mathbf{D} \mathbf{U}$ を定義する. すると,

\mathbf{D}_*=\operatorname{diag}\left(d_{i_1}, d_{i_2}, \ldots, d_{i_n}\right) .

\mathbf{A}=\mathbf{P}_*^{\prime} \mathbf{U U}^{\prime} \mathbf{D U U}^{\prime} \mathbf{P}_*=\left(\mathbf{U}^{\prime} \mathbf{P}_*\right)^{\prime} \mathbf{D}_* \mathbf{U}^{\prime} \mathbf{P}_* .

$\Delta$ を $m$ 対角成分が $\sqrt{d_{i_1}}, \sqrt{d_{i_2}}, \ldots, \sqrt{d_{i_m}}$ で, $(m+1)$ th, $(m+2)$ th, $\ldots, r$ th対角成分が $\sqrt{-d_{i_{m+1}}}, \sqrt{-d_{i_{m+2}}}, \ldots, \sqrt{-d_{i_r}}$ で,残る $n-r$ 対角成分が $1$ である対角行列とすると,

\Delta^{-1} \mathbf{D}_* \Delta^{-1}=\operatorname{diag}\left(\mathbf{I}_m,-\mathbf{I}_{r-m}, \mathbf{0}\right)

よって

\begin{aligned} \mathbf{A}=\left(\mathbf{U}^{\prime} \mathbf{P}_*\right)^{\prime} \mathbf{D}_* \mathbf{U}^{\prime} \mathbf{P}_* &=\left(\Delta \mathbf{U}^{\prime} \mathbf{P}_*\right)^{\prime} \Delta^{-1} \mathbf{D}_* \Delta^{-1} \Delta \mathbf{U}^{\prime} \mathbf{P}_* \\ &=\mathbf{P}^{\prime} \operatorname{diag}\left(\mathbf{I}_m,-\mathbf{I}_{r-m}, \mathbf{0}\right) \mathbf{P} \end{aligned}

ここで $\mathbf{P}=\Delta \mathbf{U}^{\prime} \mathbf{P}_*$ . で, $\mathbf{P}$ は非特異行列.
$\mathbf{(a)}$ から慣性指数は $\mathbf{P}$ や $\mathbf{D}$ のとり方によらないものであり, $m$ が行列 $\mathbf{A}$ の慣性指数に等しく $r=\operatorname{rank}(\mathbf{A})$ である.

$\mathbf{(c)}$ $\mathbf{B}$ が $\mathbf{A}$ に合同であると仮定する. 定義から, $n \times n$ 非特異行列 $\mathbf{P}$ に対して $\mathbf{B}=\mathbf{P}^{\prime} \mathbf{A P}$ . さらに $14.3.5$ から,
$n \times n$ 非特異行列 $\mathbf{O}$ と $n \times n$ 対角行列 $\mathbf{D}$ に対して, $\mathbf{A}=\mathbf{Q}^{\prime} \mathbf{D} \mathbf{Q}$ . したがって,

\mathbf{B}=\mathbf{P}^{\prime} \mathbf{Q}^{\prime} \mathbf{D} \mathbf{Q}=\mathbf{P}_*^{\prime} \mathbf{D} \mathbf{P}_*,

$\mathbf{P}_*=\mathbf{Q P}$ . 明らかに, $\mathbf{P}_*$ は非特異. $\mathbf{(a)}$ と照らし合わせて, $\mathbf{B}$ は $\mathbf{A}$ と同じランクと慣性指数をもつ.
逆に、以下のように仮定します: $\mathbf{A}$ と $\mathbf{B}$ が同じランク $r$ を持ち, 同じ慣性指数 $m$ をもつ. すると $\mathbf{(b)}$ から, $\mathbf{A}=\mathbf{P}^{\prime} \operatorname{diag}\left(\mathbf{I}_m,-\mathbf{I}_{r-m}, \mathbf{0}\right) \mathbf{P}$ と $\mathbf{B}=\mathbf{Q}^{\prime} \operatorname{diag}\left(\mathbf{I}_m,-\mathbf{I}_{r-m}, \mathbf{0}\right) \mathbf{Q}$ が $n \times n$ 非特異行列 $\mathbf{P}$ と $\mathbf{Q}$ にいえる. 従って,

\left(\mathbf{Q}^{\prime}\right)^{-1} \mathbf{B} \mathbf{Q}^{-1}=\operatorname{diag}\left(\mathbf{I}_m,-\mathbf{I}_{r-m}, \mathbf{0}\right)=\left(\mathbf{P}^{-1}\right)^{\prime} \mathbf{A} \mathbf{P}^{-1},

\mathbf{B}=\mathbf{Q}^{\prime}\left(\mathbf{P}^{-1}\right)^{\prime} \mathbf{A} \mathbf{P}^{-1} \mathbf{Q}=\mathbf{P}_*^{\prime} \mathbf{A} \mathbf{P}_* \text {, }

ここで $\mathbf{P}_*=\mathbf{P}^{-1} \mathbf{Q}$ . 明らかに, $\mathbf{P}_*$ は非特異で $\mathbf{B}$ は $\mathbf{A}$ と合同である.
$\mathbf{(d)}$ $\mathbf{(b)}$ から,

\mathbf{A}=\mathbf{P}^{\prime} \operatorname{diag}\left(\mathbf{I}_m,-\mathbf{I}_{r-m}, \mathbf{0}\right) \mathbf{P}

ここで $\mathbf{P}$ は $n \times n$ 非特異行列. 14.2.15から $\mathbf{A}$ は $m=r$ のときに限って非負定値であり $m=r=n$ のときに限って正定値である.

系14.2.15. $\mathbf{P}$ を $n \times n$ 非特異行列, $\mathbf{D}=\left\{d_i\right\}$ を $n \times n$ 対角行列とする. このとき, (1) $d_1, \ldots, d_n$ が非負のときかつそのときに限って, $\mathbf{P}^{\prime} \mathbf{DP}$ は非負定値である. (2) $d_1, \ldots, d_n$ が正のときかつそのときに限って, $\mathbf{P}^{\prime} \mathbf{DP}$ は正定値である. (3) $i=1, \ldots, n$ に対して $d_i \geq 0$ であり, $i$ の少なくとも 1つの値に対して等号が成り立つときかつそのときに限って, $\mathbf{P}^{\prime} \mathbf{DP}$ は半正定値である.

13.

$\mathbf{A}$ を階数 $r$ の $n \times n$ 対称非負定値行列とする.このとき, 定理14.3.7により, $\mathbf{A}=\mathbf{B B}^{\prime}$ を満たす (階数 $r$ の) $n \times r$ 行列 $\mathbf{B}$ が存在する. $\mathbf{X}$ を $\mathbf{A}=\mathbf{X X}^{\prime}$ を満たす任意, $n \times m$ 行列とする (ここで $m \geq r$ とする).
$\mathbf{(a)}$ $\mathbf{X}=\mathbf{P}_{\mathbf{B}} \mathbf{X}$ を示せ.
$\mathbf{(b)}$ ある直交行列 $\mathbf{Q}$ に対して $\mathbf{X}=(\mathbf{B}, \mathbf{0}) \mathbf{Q}$ を示せ.

定理 14.3.7. $n \times n$ 行列 $\mathbf{A}(\neq \mathbf{0})$ は, $\mathbf{A}=\mathbf{P}^{\prime} \mathbf{P}$ を満たす階数 $r$ の $r \times n$ 行列 $\mathbf{P}$ が存在するときかつそのときに限って, 階数 $r$ の対称非負定値行列である.

$\mathbf{(a)}$

系7.4.5 (p.88) より、 $\mathcal{C}(\mathbf{X}) = \mathcal{C}(\mathbf{A}) = \mathcal{C}(\mathbf{B})$ 。したがって、系12.3.6 (p.199) より、 $\mathbf{P_{x}} = \mathbf{P_{B}}$ (ここで、 $\mathbf{P_{x}} = \mathbf{X}(\mathbf{X}'\mathbf{X})^{-1}\mathbf{X}'$ )。よって、定理12.3.4 (1) (p.196) より、 $\mathbf{P}_{\mathbf{B}} \mathbf{X} = \mathbf{P}_{\mathbf{X}} \mathbf{X} = \mathbf{X}$ 。

$\mathbf{(b)}$

系7.4.5 (p.88) より、 $\mathrm{rank}(\mathbf{B}'\mathbf{B}) = \mathrm{rank}(\mathbf{B}) = r$ なので、 $\mathbf{B}'\mathbf{B}$ は正規行列である。 $\mathbf{(a)}$ より、

\mathbf{X} = \mathbf{P}_{\mathbf{B}} \mathbf{X} = \mathbf{B}(\mathbf{B}'\mathbf{B})^{-1}\mathbf{B}'\mathbf{X} \tag{*}.

ここで、 $\mathbf{Q_1} = (\mathbf{B}'\mathbf{B})^{-1}\mathbf{B}'\mathbf{X}$ とおく。

\begin{aligned} \mathbf{Q_1}\mathbf{Q_1}' &= (\mathbf{B}'\mathbf{B})^{-1}\mathbf{B}'\mathbf{X}\mathbf{X}'\mathbf{B}(\mathbf{B}'\mathbf{B})^{-1} \\ &= (\mathbf{B}'\mathbf{B})^{-1}\mathbf{B}'\mathbf{A}\mathbf{B}(\mathbf{B}'\mathbf{B})^{-1} \\ &= (\mathbf{B}'\mathbf{B})^{-1}\mathbf{B}'\mathbf{B B}'\mathbf{B}(\mathbf{B}'\mathbf{B})^{-1} \\ &= \mathbf{I} \end{aligned}

より、 $r \times m$ 行列 $\mathbf{Q_1}$ は正規直交する。
よって、定理6.4.5 (p.78) より、 $\mathbf{Q} = (\mathbf{Q_1} \mathbf{Q_2})'$ が直交行列となるような、 $(m - r) \times m$ 行列 $\mathbf{Q_2}$ が存在する。
上記の $\mathbf{Q}$ に対して、 $(\mathbf{B}, \mathbf{0}) \mathbf{Q} = \mathbf{B}\mathbf{Q_1}$ となるが、式 $(*)$ より、これは $\mathbf{X}$ に等しい。

14.

もし対称行列 $\mathbf{A}$ が非負定値一般逆行列をもつならば， $\mathbf{A}$ は非負定値であることを示せ.

対称行列 $\mathbf{A}$ の一般化逆行列を $\mathbf{G}$ と置くと、 $\mathbf{A}=\mathbf{A G A}=\mathbf{A}^{\prime} \mathbf{G A}$ である。
定理14.2.9(1)に照らして、（ $\mathbf{G}$ が非負定値であるから）上式の最右辺が非負定値であると言える。

定理 14.2.9. $\mathbf{A}$ を $n \times n$ 行列, $\mathbf{P}$ を $n \times m$ 行列とする. (1) もし $\mathbf{A}$ が非負定値ならば, $\mathbf{P}^{\prime} \mathbf{A P}$ も非負定値である. (2) もし A が非負定値でかつ $\operatorname{rank}(\mathbf{P})<m$ ならば, $\mathbf{P}^{\prime} \mathbf{A P}$ は半正定値である. (3) もし $\mathbf{A}$ が正定値でかつ $\operatorname{rank}(\mathbf{P})=m$ ならば, $\mathbf{P}^{\prime} \mathbf{A P}$ は正定値である.

はじめに

第14章 練習問題

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

13.

14.

Discussion

第14章練習問題