はじめに
統計のための行列代数 練習問題 解答例まとめを参照
第14章 練習問題
1.
( n 次元ベクトル\mathbf{x}, \mathbf{y} に関する)対称な双線形形式\mathbf{x}^{\prime} \mathbf{A} \mathbf{y}は対応する二次形式, すなわち, 行列が\mathbf{A}の二次形式を用いて表せることを示せ. それには
\mathbf{x}^{\prime} \mathbf{A} \mathbf{y}=(1 / 2)\left[(\mathbf{x}+\mathbf{y})^{\prime} \mathbf{A}(\mathbf{x}+\mathbf{y})-\mathbf{x}^{\prime} \mathbf{A} \mathbf{x}-\mathbf{y}^{\prime} \mathbf{A y}\right]
を証明せよ.
対称な双線形形式の定義:\mathbf{x}^{\prime} \mathbf{A y}=\mathbf{y}^{\prime} \mathbf{A x}、\mathbf{A}=\mathbf{A}^{\prime}を使うと以下の式展開ができる。
\begin{aligned}
(1 / 2)\left[(\mathbf{x}+\mathbf{y})^{\prime} \mathbf{A}\right.&\left.(\mathbf{x}+\mathbf{y})-\mathbf{x}^{\prime} \mathbf{A x}-\mathbf{y}^{\prime} \mathbf{A} \mathbf{y}\right] \\
&=(1 / 2)\left(\mathbf{x}^{\prime} \mathbf{A x}+\mathbf{x}^{\prime} \mathbf{A y}+\mathbf{y}^{\prime} \mathbf{A x}+\mathbf{y}^{\prime} \mathbf{A} \mathbf{y}-\mathbf{x}^{\prime} \mathbf{A x}-\mathbf{y}^{\prime} \mathbf{A y}\right) \\
&=(1 / 2)\left(\mathbf{x}^{\prime} \mathbf{A} \mathbf{y}+\mathbf{y}^{\prime} \mathbf{A x}\right)=(1 / 2)\left(\mathbf{x}^{\prime} \mathbf{A} \mathbf{y}+\mathbf{x}^{\prime} \mathbf{A y}\right)=\mathbf{x}^{\prime} \mathbf{A y}
\end{aligned}
2.
(n次元ベクトル\mathbf{x}に関する) 任意の二次形式 \mathbf{x}^{\prime} \mathbf{A} \mathbf{x} に対応して \mathbf{x}^{\prime} \mathbf{A} \mathbf{x} と \mathbf{x}^{\prime} \mathbf{B} \mathbf{x} が恒等的に等しいような一意な上三角行列\mathbf{B}が存在することを示せ. また\mathbf{A}の要素を用いて\mathbf{B}の要素を表せ.
a_{ij}, b_{ij}をそれぞれ行列\mathbf{A}, \mathbf{B}のij成分を表すとする(i, j=1, \ldots, n)。補助定理14.1.1から、j \neq i=1, \ldots, nに対して、a_{ii}=b_{ii}かつa_{ij}+a_{ji}=b_{ij}+b_{ji}のときかつそのときに限って\mathbf{x}^{\prime} \mathbf{A} \mathbf{x}と\mathbf{x}^{\prime} \mathbf{B} \mathbf{x}が恒等的に等しいことが示されている。
この補助定理に従えば、b_{ji} = 0 (j>i=1, \ldots, n)とすることで、a_{ii}=b_{ii}かつa_{ij}+a_{ji}=b_{ij}となるような行列\mathbf{B}を作ることも可能であり、かつ一意に定まる。そしてこの場合に限って行列\mathbf{B}は上三角行列となるので、題意が示される。
補助定理 14.1.1. \mathbf{A}=\left\{a_{ij}\right\}, \mathbf{B}=\left\{b_{ij}\right\}を任意のn \times n行列とする. (\mathbf{x}に関する)2つの二次形式\mathbf{x}^{\prime} \mathbf{A} \mathbf{x}, \mathbf{x}^{\prime} \mathbf{B x}は, j \neq i=1, \ldots, nに対して,a_{ii}=b_{ii}かつa_{ij}+a_{ji}=b_{ij}+b_{ji}のときかつそのときに限って, すなわち, \mathbf{A}+\mathbf{A}^{\prime}=\mathbf{B}+\mathbf{B}^{\prime}のときかつそのときに限って, 恒等的に等しい.
3.
2つの半正定値行列の和が正定値となる例を挙げよ.
2つの2 \times 2行列\begin{pmatrix}1 & 0 \\ 0 & 0\end{pmatrix} と\begin{pmatrix}0 & 0 \\ 0 & 1\end{pmatrix}を考える。
それぞれの行列は(対角行列の対角成分が0または1なので、補助定理14.2.1により)半正定値行列であるが、その和\begin{pmatrix}1 & 0 \\ 0 & 1\end{pmatrix}は正定値である。
補助定理14.2.1. \mathbf{D}=\left\{d_i\right\}をn \times n対角行列とする. このとき, (1)\ d_1, \ldots, d_nが非負値のときかつそのときに限って, \mathbf{D}は非負定値である. (2)\ d_1, \ldots, d_nが正のときかつそのときに限って, \mathbf{D}は正定値である. (3)\ i=1, \ldots, nに対してd_i \geq 0でありiの少なくとも1個の値に対して等号が成り立つときかつそのときに限って, \mathbf{D}は半正定値である.
4.
(非対称で)非特異な半正定値行列が存在することを例を挙げて示せ.
あらゆる\mathbf{x} \in \mathcal{R}^nに対して\mathbf{x}^{\prime} \mathbf{A} \mathbf{x}\geq0で, あるx \neq 0に対して\mathbf{x}^{\prime}\mathbf{A x}=0の時\mathbf{A}は半正定値である.
系8.5.6 三角行列はその対角要素がいずれも0でないときかつその時に限って、非特異である。
以下のn\times n上三角行列を考える
\mathbf{A}=\begin{pmatrix}
1 & 2 & 0 & \ldots & 0 \\
0 & 1 & 0 & \ldots & 0 \\
0 & 0 & 1 & \ldots & 0 \\
\vdots & \vdots & & \ddots & \\
0 & 0 & 0 & & 1
\end{pmatrix}
任意のn次元ベクトル\mathbf{x}=\left(x_1, x_2, x_3, \ldots, x_n\right)^{\prime}に対して以下が成り立つ。
\mathbf{x}^{\prime} \mathbf{A} \mathbf{x}=\left(x_1+x_2\right)^2+x_3^2+\cdots+x_n^2 \geq 0
もし、x_1=-x_2、x_3=\cdots=x_n=0の場合\mathbf{x}^{\prime} \mathbf{A x}=0となる。
よって、\mathbf{A}は半正定値となる。また、系8.5.6より\mathbf{A}は非特異である。
5.
\mathbf{P}^{\prime}\mathbf{AP}が正定値となるようなn \times n半正定値行列\mathbf{A}とn \times m行列\mathbf{P}が存在することを例を挙げて示せ(ここでm \lt nとする) .
\mathbf{A} = \begin{pmatrix}\mathbf{I}_{m} & \mathbf{0} \\ \mathbf{0} & \mathbf{0}\end{pmatrix}で表されるn\times n行列(m \lt n)を考える。これは明らかに半正定値行列となる。そして\mathbf{P}を\begin{pmatrix}\mathbf{I}_{m} \\ \mathbf{0}\end{pmatrix}のようなn\times m行列とする。これについて\mathbf{P}^{\prime}\mathbf{AP}を計算すると
\begin{aligned}
\mathbf{P}^{\prime}\mathbf{AP}
&= \begin{pmatrix}\mathbf{I}_{m} ,\mathbf{0}\end{pmatrix} \begin{pmatrix}\mathbf{I}_{m} & \mathbf{0} \\ \mathbf{0} & \mathbf{0}\end{pmatrix} \begin{pmatrix}\mathbf{I}_{m} \\ \mathbf{0}\end{pmatrix} \\
&= \begin{pmatrix}\mathbf{I}_{m} ,\mathbf{0}\end{pmatrix}\begin{pmatrix}\mathbf{I}_{m} \\ \mathbf{0}\end{pmatrix} \\
&= \mathbf{I}_{m}
\end{aligned}
これは明らかにm\times mの正定値行列である。
6.
非負定値(正定値あるいは半正定値)行列に対する定理14.2.9 の結果(1)一(3) を非正定値行列に対する同値な結果に変えよ.
定理14.2.9
\mathbf{A}をn\times n行列、\mathbf{P}をn\times m行列とする。
(1)もし\mathbf{A}が非負定値ならば、\mathbf{P}'\mathbf{A}\mathbf{P}も非負定値である。
(2)もし\mathbf{A}が非負定値でかつ\operatorname{rank}(\mathbf{P})<mならば、\mathbf{P}'\mathbf{A}\mathbf{P}は半正定値である。
(3)もし\mathbf{A}が正定値でかつ\operatorname{rank}(\mathbf{P})=mならば、\mathbf{P}'\mathbf{A}\mathbf{P}も正定値である。
上記の定理14.2.9の結果における\mathbf{A}を-\mathbf{A}に置き換えることで、非正定値に対する結果を得る:
(1)もし-\mathbf{A}が非負定値ならば、-\mathbf{P}'\mathbf{A}\mathbf{P}も非負定値である。
(2)もし-\mathbf{A}が非負定値でかつ\operatorname{rank}(\mathbf{P})<mならば、-\mathbf{P}'\mathbf{A}\mathbf{P}は半正定値である。
(3)もし-\mathbf{A}が正定値でかつ\operatorname{rank}(\mathbf{P})=mならば、-\mathbf{P}'\mathbf{A}\mathbf{P}も正定値である。
これを言い換えると以下の結果を得る:
(1)もし\mathbf{A}が非正定値ならば、\mathbf{P}'\mathbf{A}\mathbf{P}も非正定値である。
(2)もし\mathbf{A}が非正定値でかつ\operatorname{rank}(\mathbf{P})<mならば、\mathbf{P}'\mathbf{A}\mathbf{P}は半負定値である。
(3)もし\mathbf{A}が負定値でかつ\operatorname{rank}(\mathbf{P})=mならば、\mathbf{P}'\mathbf{A}\mathbf{P}も負定値である。
7.
\left\{\mathbf{X}_1, \ldots, \mathbf{X}_r\right\} を線形空間 \mathcal{V} からの行列の集合, \mathbf{A}=\left\{a_{i j}\right\}を第ij要素が \mathbf{X}_i \cdot \mathbf{X}_jのr \times r行列とする―この行列を集合\left\{\mathbf{X}_1, \ldots, \mathbf{X}_r\right\}のグラムの行列(Gram matrix) (あるいはグラミアン (Gramian) と呼び, その行列式を\left\{\mathbf{X}_1, \ldots, \mathbf{X}_r\right\}のグラミアン (Gramian) あるいはグラムの行列式 (Gram determinant) と呼ぶ.
\mathbf{(a)} \mathbf{A}が対称で非負定値であることを示せ.
\mathbf{(b)} \mathbf{A}が非特異のときかつそのときに限って,\mathbf{X}_1, \ldots, \mathbf{X}_rが線形独立であることを示せ.
\mathbf{(a)} \mathbf{Y}_1, \dots , \mathbf{Y}_nは\mathcal{V}の正規直交基底を形成する任意の行列であるとする。1,\ldots,rに対して,以下を満たすようなスカラーb_{1j}, \ldots , b_{nj}が存在するとする.
\mathbf{X}_j=b_{1 j} \mathbf{Y}_1+\cdots+b_{n j} \mathbf{Y}_n .
このとき、i,j =1,\ldots ,rに対して
\begin{aligned}
a_{i j}=\mathbf{X}_i \cdot \mathbf{X}_j &=\left(\sum_{k=1}^n b_{k i} \mathbf{Y}_k\right) \cdot\left(\sum_{s=1}^n b_{s j} \mathbf{Y}_s\right) \\
&=\sum_{k=1}^n b_{k i}\left[\mathbf{Y}_k \cdot\left(\sum_{s=1}^n b_{s j} \mathbf{Y}_s\right)\right] \\
&=\sum_{k=1}^n b_{k i} \sum_{s=1}^n b_{s j}\left(\mathbf{Y}_s \cdot \mathbf{Y}_k\right) \\
&=\sum_{k=1}^n b_{k i} b_{k j}
\end{aligned}
である.このとき, \sum_{k=1}^n b_{k i} b_{k j} は r \times r 行列 \mathbf{B}^{\prime} \mathbf{B} のij 成分 である. ここで行列\mathbf{B} は k j 成分がb_{k j}の n \times r 行列である. (したがって転置行列の\mathbf{B}^{\prime}はi k 成分が b_{k i}のr \times n 行列である ). これらから, \mathbf{A}=\mathbf{B}^{\prime} \mathbf{B}, であり\mathbf{B}^{\prime} \mathbf{B} 対称で非負定値行列(系14.2.14より)であるから(a)が示された.
系14.2.14. \mathbf{P} を任意の n \times m 行列とする. m \times m 行列 \mathbf{P}^{\prime} \mathbf{P} は非負定値で ある. もし \operatorname{rank}(\mathbf{P})=m ならば, \mathbf{P}^{\prime} \mathbf{P} は正定値であり, そうでなければ(も し \operatorname{rank}(\mathbf{P})<m ならば), \mathbf{P}^{\prime} \mathbf{P} は半正定値である.
\mathbf{(b)}
次にj=1, \ldots, r, に対して \mathbf{b}_j=\left(b_{1 j}, \ldots, b_{n j}\right)^{\prime}が存在するとする. このとき \mathbf{Y}_1, \ldots, \mathbf{Y}_n は線型独立であるため(直交基底であると仮定しているため), 定理 3.2.4 に照らして\mathbf{X}_1, \ldots, \mathbf{X}_r は\mathbf{b}_1, \ldots, \mathbf{b}_r が線型独立であるときに限り,かつそのときに限って線型独立である. したがって\mathbf{b}_1, \ldots, \mathbf{b}_r は\mathbf{B}の列ベクトルであるため, \mathbf{X}_1, \ldots, \mathbf{X}_r は \operatorname{rank}(\mathbf{B})=r あるいは同値な表現として系7.4.5を用いて \operatorname{rank}\left(\mathbf{B}^{\prime} \mathbf{B}\right)=r. が成り立つときにかつそのときに限って線形独立である.また \mathbf{A}=\mathbf{B}^{\prime} \mathbf{B}であるため \mathbf{X}_1, \ldots, \mathbf{X}_r は\mathbf{A} が非特異のときかつそのときに限って線型独立であることがわかる.
8.
\mathbf{A} = \{a_{ij} \}をn \times n対称、正定値行列\mathbf{B} = \{b_{ij}\} = \mathbf{A}^{-1}とする. i = 1,\ldots, nに対して
であり,等号はすべてのj\neq iに対してa_{ij} = 0のときかつそのときに限って成り立つことを示せ.
解
9.
\mathbf{A}をm \times n行列,\mathbf{D}を最大列階数の適当な行列\mathbf{P}と最大行階数の適当な行列\mathbf{Q}に対して\mathbf{A} = \mathbf{PDQ}と表される対角行列とする. \operatorname{rank}(\mathbf{A})が\mathbf{D}の中の0でない対角要素の数に等しいことを示して補助定理14.3.1の結果を拡張せよ.
補助定理 14.3.1. \mathbf{A}をn \times n行列, \mathbf{D}を適当なn \times n非特異行列\mathbf{P}, \mathbf{Q}に対して\mathbf{A}=\mathbf{P D Q}と表されるn \times n 対角行列とする. このとき, \operatorname{rank}(\mathbf{A})は\mathbf{D}の中の0でない対角要素の数に等しい.
補助定理 8.3.2. \mathbf{A} をm \times n 行列, B をn \times p行列とする.もし\mathbf{A}が最大列階数をもつならば,
\mathcal{R}(\mathbf{AB}) =\mathcal{R}(\mathbf{B}),\quad \operatorname{rank}(\mathbf{AB}) = \operatorname{rank}(\mathbf{B})である.同様に,もし\mathbf{B}が最大行階数をもつならば,\mathcal{C}(\mathbf{AB}) =\mathcal{C}(\mathbf{A}), \quad \operatorname{rank}(\mathbf{AB}) = \operatorname{rank}(\mathbf{A})である.
補助定理8.3.2より、
\operatorname{rank}(\mathbf{A}) = \operatorname{rank}(\mathbf{P}\mathbf{D}\mathbf{Q}) = \operatorname{rank}(\mathbf{D}\mathbf{Q}) = \operatorname{rank}(\mathbf{D})
が成り立つ。今\mathbf{D}は対角行列なので、その階数は0でない対角要素の数に等しい。
10.
\mathbf{A}をn \times n対称冪等行列,\mathbf{V}を対称正定値行列とする.\operatorname{rank}(\mathbf{AVA}) = \operatorname{tr}(\mathbf{A})を示せ.
定理14.3.13より、ある非特異行列\mathbf{P}に対して、\mathbf{V}=\mathbf{P}^{\prime} \mathbf{P}となる。
従って、系7.4.5・系8.3.3・系10.2.2を用いて次が示される。
\operatorname{rank}(\mathbf{A V A})=\operatorname{rank}\left[(\mathbf{P A})^{\prime} \mathbf{P A}\right]=\operatorname{rank}(\mathbf{P A})=\operatorname{rank}(\mathbf{A})=\operatorname{tr}(\mathbf{A}).
系14.3.13.n \times n行列\mathbf{A}は、\mathbf{A}=\mathbf{P}^{\prime} \mathbf{P}を満たす非特異行列\mathbf{P}が存在するときかつそのときに限って、対称正定値行列である。
系7.4.5. 任意の行列\mathbf{A}に対して、
\mathcal{C}\left(\mathbf{A}^{\prime} \mathbf{A}\right)=\mathcal{C}\left(\mathbf{A}^{\prime}\right), \mathcal{R}\left(\mathbf{A}^{\prime} \mathbf{A}\right)=\mathcal{R}(\mathbf{A}),\operatorname{rank}\left(\mathbf{A}^{\prime} \mathbf{A}\right)=\operatorname{rank}(\mathbf{A})
が成り立つ。
系8.3.3. もし\mathbf{A}がn \times n非特異行列ならば、任意のn \times p行列\mathbf{B}に対して、
\mathcal{R}(\mathbf{A B})=\mathcal{R}(\mathbf{B}), \quad \operatorname{rank}(\mathbf{A B})=\operatorname{rank}(\mathbf{B})である。同様に、もし\mathbf{B}がn \times n非特異行列ならば、任意のm \times n行列\mathbf{A}に対して、\mathcal{C}(\mathbf{A B})=\mathcal{C}(\mathbf{A}), \quad \operatorname{rank}(\mathbf{A B})=\operatorname{rank}(\mathbf{A})である。
系10.2.2. 任意の冪等行列Aに対して、
\operatorname{rank}(\mathbf{A})=\operatorname{tr}(\mathbf{A})である。
11.
もしn \times n行列\mathbf{A}があらゆるn次元列ベクトル\mathbf{x} \neq \mathbf{0}に対して\mathbf{x}^{\prime} \mathbf{A x} \neq 0を満たせば,\mathbf{A}は正定値か負定値かのどちらかであることを示せ.
対称行列\mathbf{B}を\mathbf{B}=(1 / 2)\left(\mathbf{A}+\mathbf{A}^{\prime}\right)で定めると任意の\mathbf{x}に対して\mathbf{x}^{\prime} \mathbf{B x}=\mathbf{x}^{\prime} \mathbf{A x}が成り立つ。\mathbf{B}は対称なので系14.3.5より\mathbf{B}=\mathbf{P}^{\prime} \mathbf{D P}を満たす 非特異行列\mathbf{P}と対角行列\mathbf{D}=\operatorname{diag}\left(d_1, \ldots, d_n\right)が存在する。
よって、任意の\mathbf{x}に対して\mathbf{x}^{\prime} \mathbf{A x} = \mathbf{x}^{\prime} \mathbf{B x} = (\mathbf{P x})^{\prime} \mathbf{D P x} \neq 0が成り立つ。
ここで、もしd_i=0なるiが存在したとすると、\mathbf{P x} = \mathbf{e}_i(\mathbf{e}_iは第i成分のみ1で他が0のベクトル) を満たす\mathbf{x}をとれば
(\mathbf{P x})^{\prime} \mathbf{D P x}=\mathbf{e}_i^{\prime} \mathbf{D e}_i=d_i=0
となり矛盾するので、全てのiに対してd_i \neq 0である。
さらに、もしd_i\gt 0かつd_j<0であるようなi, jが存在したとすると、\mathbf{P x} = \mathbf{y}(ただし\mathbf{y}は第i成分が1 / \sqrt{d_i}で第j成分が1 / \sqrt{-d_j}であるベクトル) を満たす\mathbf{x}をとれば
(\mathbf{P x})^{\prime} \mathbf{D} \mathbf{P x}=\mathbf{y}^{\prime} \mathbf{D y}=d_i (1 / \sqrt{d_i})^2 + d_j (1 / \sqrt{-d_j})^2 = 1 - 1 =0
となり矛盾するので、全てのiに対してd_i \gt 0であるか、または全てのiに対してd_i < 0である。系14.2.15より、前者の場合\mathbf{B}は正定値であり、後者の場合\mathbf{B}は負定値である。\mathbf{A}についても同様である。
系14.2.15. \mathbf{P}をn \times n非特異行列, \mathbf{D}=\left\{d_i\right\}をn \times n対角行列とする. このとき, (1) d_1, \ldots, d_nが非負のときかつそのときに限って, \mathbf{P}^{\prime} \mathbf{DP}は非負定値である. (2) d_1, \ldots, d_nが正のときかつそのときに限って, \mathbf{P}^{\prime} \mathbf{DP}は正定値である. (3) i=1, \ldots, nに対してd_i \geq 0であり, iの少なくとも 1つの値に対して等号が成り立つときかつそのときに限って, \mathbf{P}^{\prime} \mathbf{DP}は半正定値である.
12.
\mathbf{(a)} \mathbf{A}を階数rのn \times n対称行列とする.\mathbf{P}をn \times n非特異行列,\mathbf{D}をn \times n対角行列で\mathbf{A}=\mathbf{P}^{\prime} \mathbf{D P}を満たすものとする―この行列の存在は系14.3.5によって保証されている.\mathbf{D}の対角要素のうち正のものの個数mを\mathbf{A}の(あるいは行列\mathbf{A}による二次形式\mathbf{x}^{\prime} \mathbf{Ax}の) 慣性指数 (index of inertia) と呼ぶ.この慣性指数は,mが\mathbf{P}や\mathbf{D}のとり方によらないという意味において明確に定義されることを示せ。すなわち,もし\mathbf{P}_1, \mathbf{P}_2が非特異行列で\mathbf{D}_1, \mathbf{D}_2が\mathbf{A}=\mathbf{P}_1^{\prime}\mathbf{D}_1 \mathbf{P}_1=\mathbf{P}_2^{\prime} \mathbf{D}_2 \mathbf{P}_2を満たす対角行列ならば,\mathbf{D}_1,\mathbf{D}_2は同じ個数の正の対角要素をもつことを示せ.また\mathbf{D}の対角要素のうち負のものの個数がr-mであることを示せ。
\mathbf{(b)} \mathbf{A}をn \times n対称行列とする. あるn \times n非特異行列\mathbf{P}とある非負の整数m,rに対して\mathbf{A}=\mathbf{P}^{\prime} \operatorname{diag}\left(\mathbf{I}_m,-\mathbf{I}_{r-m}, \mathbf{0}\right) \mathbf{P}であることを示せ. 更に,mが行列\mathbf{A}の慣性指数に等しくr=\operatorname{rank}(\mathbf{A})であることを示せ.
\mathbf{(c)} n \times n対称行列\mathbf{A}, \mathbf{B}について,\mathbf{B}=\mathbf{P}^{\prime} \mathbf{A} \mathbf{P}を満たすn \times n非特異行列\mathbf{P}が存在するとき,\mathbf{BA}に合同 (congruent) であると言う. (もし\mathbf{B}が\mathbf{A}に合同ならば, 明らかに\mathbf{A}は\mathbf{B}に合同である.)\mathbf{B}が\mathbf{A}と同じ階数と同じ慣性指数をもつときかつそのときに限って,\mathbf{B}が\mathbf{A}に合同であることを示せ. この結果を, James Joseph Sylvester (1814-1897) にちなんでシルヴェスターの慣性法則 (Sylvester's law of inertia) と呼ぶ.
\mathbf{(d)} \mathbf{A}を慣性指数mをもつ階数rのn \times n対称行列とする.\mathbf{A}はm=rのときかつそのときに限って,非負定値であり,m=r=nときかつそのときに限って, 正定値であることを示せ。
\mathbf{(a)} \mathbf{P}_1,\mathbf{P}_2を非特異行列,\mathbf{D}_1=\left\{d_i^{(1)}\right\},\mathbf{D}_2=\left\{d_i^{(2)}\right\}を\mathbf{A}=\mathbf{P}_1^{\prime} \mathbf{D}_1 \mathbf{P}_1=\mathbf{P}_2^{\prime} \mathbf{D}_2 \mathbf{P}_2を満たすn \times nの対角行列とする.m_1,m_2をそれぞれ\mathbf{D}_1,\mathbf{D}_2の対角成分のうち正のものの個数とする.
i_1, i_2, \ldots, i_nをd_{i_j}^{(1)}\gt 0 for j=1,2, \ldots, m_1,となるような置換とする. 同様にk_1, k_2, \ldots, k_nをd_{k_j}^{(2)}\gt 0 for j=1,2, \ldots, m_2となりような置換とする.
\mathbf{U}_1を1, 2, \ldots, n列がそれぞれ\mathbf{I}_nのi_1,i_2,\ldots, i_n列になるようなn \times nの置換行列, \mathbf{U}_2を1,2,\ldots, n列が\mathbf{I}_nのk_1,k_2,\ldots, k_n列になっているn \times nの置換行列,\mathbf{D}_1^*,\mathbf{D}_2^*を\mathbf{D}_1^*=\mathbf{U}_1^{\prime} \mathbf{D}_1 \mathbf{U}_1と\mathbf{D}_2^*=\mathbf{U}_2^{\prime} \mathbf{D}_2 \mathbf{U}_2のように定義する.
すると,\mathbf{D}_1^*=\operatorname{diag}\left(d_{i_1}^{(1)}, d_{i_2}^{(1)}, \ldots, d_{i_n}^{(1)}\right)で\mathbf{D}_2^*=\operatorname{diag}\left(d_{k_1}^{(2)}, d_{k_2}^{(2)}, \ldots, d_{k_n}^{(2)}\right)
m_1<m_2を仮定して矛盾を導く(同様にm_1\gt m_2も導く)
\begin{aligned}
\mathbf{D}_2^*=\mathbf{U}_2^{\prime}\left(\mathbf{P}_2^{-1}\right)^{\prime} \mathbf{A} \mathbf{P}_2^{-1} \mathbf{U}_2 &=\mathbf{U}_2^{\prime}\left(\mathbf{P}_2^{-1}\right)^{\prime} \mathbf{P}_1^{\prime} \mathbf{D}_1 \mathbf{P}_1 \mathbf{P}_2^{-1} \mathbf{U}_2 \\
&=\mathbf{U}_2^{\prime}\left(\mathbf{P}_2^{-1}\right)^{\prime} \mathbf{P}_1^{\prime} \mathbf{U}_1 \mathbf{D}_1^* \mathbf{U}_1^{\prime} \mathbf{P}_1 \mathbf{P}_2^{-1} \mathbf{U}_2=\mathbf{R}^{\prime} \mathbf{D}_1^* \mathbf{R}
\end{aligned}
\mathbf{R}=\mathbf{U}_1^{\prime} \mathbf{P}_1 \mathbf{P}_2^{-1} \mathbf{U}_2. n \times n行列\mathbf{R}を次のように分割する:\mathbf{R}=\left(\begin{array}{ll}\mathbf{R}_{11} & \mathbf{R}_{12} \\ \mathbf{R}_{21} & \mathbf{R}_{22}\end{array}\right), \mathbf{R}_{11}はm_1 \times m_2行列.
\mathbf{x}=\left\{x_j\right\}を\mathbf{R}_{11} \mathbf{x}=\mathbf{0}を満たすようなm_2-次元の非ゼロベクトルとすると, 仮定したm_1<m_2から, そのようなベクトル\mathbf{x}が存在する.y_1, y_2, \ldots, y_{n-m_1},をベクトル\mathbf{R}_{21} \mathbf{x}の要素として導入すると,
\begin{aligned}
\sum_{j=1}^{m_2} d_{k_j}^{(2)} x_j^2=\left(\begin{array}{c}
\mathbf{x} \\
\mathbf{0}
\end{array}\right)^{\prime} \mathbf{D}_2^*\left(\begin{array}{l}
\mathbf{x} \\
\mathbf{0}
\end{array}\right) &=\left(\begin{array}{l}
\mathbf{x} \\
\mathbf{0}
\end{array}\right)^{\prime} \mathbf{R}^{\prime} \mathbf{D}_1^* \mathbf{R}\left(\begin{array}{l}
\mathbf{x} \\
\mathbf{0}
\end{array}\right) \\
&=\left(\begin{array}{c}
\mathbf{0} \\
\mathbf{R}_{21} \mathbf{x}
\end{array}\right)^{\prime} \mathbf{D}_1^*\left(\begin{array}{c}
\mathbf{0} \\
\mathbf{R}_{21} \mathbf{x}
\end{array}\right) \\
&=\sum_{j=m_1+1}^n d_{i_j}^{(1)} y_{j-m_1}^2
\end{aligned}
さらに,
\sum_{j=1}^{m_2} d_{k_j}^{(2)} x_j^2\gt 0,
ここで \mathbf{D}_1^*のn-m_1個の対角成分がゼロまたは負なので,
\sum_{j=m_1+1}^{n} d_{i_j}^{(1)} y_{j-m_1}^2 \leq 0,
ここに連なる3つの等式・不等式は互いに矛盾するため,m_1<m_2という仮定は偽である.
よってm_1 \geq m_2
同等の議論をm_1\gt m_2に対しても適用して, m_1 \leq m_2が言える. これとm_1 \geq m_2を組み合わせて, m_2=m_1.
補助定理14.3.1から, \mathbf{D}の非ゼロ対角成分の数はr. \mathbf{D}の負の対角成分はr-m.
補助定理 14.3.1. \mathbf{A}をn \times n 行列, \mathbf{D}を適当なn \times n非特異行列 \mathbf{P}, \mathbf{Q}に対して\mathbf{A}=\mathbf{P D Q}と表されるn \times n対角行列とする. このとき, \operatorname{rank}(\mathbf{A})は\mathbf{D}の中の0でない対角要素の数に等しい.
\mathbf{(b)} 系14.3.5から,n \times n非特異行列\mathbf{P}_*とn \times n対角行列\mathbf{D}=\left\{d_i\right\}に対して,\mathbf{A}=\mathbf{P}_*^{\prime} \mathbf{D} \mathbf{P}_*となるものが存在する.
系14.3.5. 任意のn\times n対称行列\mathbf{A}に対応して,\mathbf{A} = \mathbf{P}^{\prime}\mathbf{DP}となる非特異行列\mathbf{P}と対角行列\mathbf{D}が存在する.
i_1, i_2, \ldots, i_nをnまでの自然数の置換:j=1, \ldots, mに対してd_{i j}\gt 0, j=m+1, \ldots, rに対してd_{i_j}<0,j=r+1, \ldots, nに対してd_{i_j}=0.\mathbf{U}をn \times nの置換行列で, 1,2, \ldots ,nth 列が\mathbf{I}_nのi_1th,i_2th,\ldots, i_nth 列になるものとして,\mathbf{D}_*=\mathbf{U}^{\prime} \mathbf{D} \mathbf{U}を定義する. すると,
\mathbf{D}_*=\operatorname{diag}\left(d_{i_1}, d_{i_2}, \ldots, d_{i_n}\right) .
\mathbf{A}=\mathbf{P}_*^{\prime} \mathbf{U U}^{\prime} \mathbf{D U U}^{\prime} \mathbf{P}_*=\left(\mathbf{U}^{\prime} \mathbf{P}_*\right)^{\prime} \mathbf{D}_* \mathbf{U}^{\prime} \mathbf{P}_* .
\Deltaをm対角成分が\sqrt{d_{i_1}}, \sqrt{d_{i_2}}, \ldots, \sqrt{d_{i_m}}で, (m+1)th,(m+2)th,\ldots, rth対角成分が\sqrt{-d_{i_{m+1}}}, \sqrt{-d_{i_{m+2}}}, \ldots, \sqrt{-d_{i_r}}で,残るn-r対角成分が1である対角行列とすると,
\Delta^{-1} \mathbf{D}_* \Delta^{-1}=\operatorname{diag}\left(\mathbf{I}_m,-\mathbf{I}_{r-m}, \mathbf{0}\right)
よって
\begin{aligned}
\mathbf{A}=\left(\mathbf{U}^{\prime} \mathbf{P}_*\right)^{\prime} \mathbf{D}_* \mathbf{U}^{\prime} \mathbf{P}_* &=\left(\Delta \mathbf{U}^{\prime} \mathbf{P}_*\right)^{\prime} \Delta^{-1} \mathbf{D}_* \Delta^{-1} \Delta \mathbf{U}^{\prime} \mathbf{P}_* \\
&=\mathbf{P}^{\prime} \operatorname{diag}\left(\mathbf{I}_m,-\mathbf{I}_{r-m}, \mathbf{0}\right) \mathbf{P}
\end{aligned}
ここで\mathbf{P}=\Delta \mathbf{U}^{\prime} \mathbf{P}_*. で,\mathbf{P}は非特異行列.
\mathbf{(a)}から慣性指数は\mathbf{P}や\mathbf{D}のとり方によらないものであり,mが行列\mathbf{A}の慣性指数に等しくr=\operatorname{rank}(\mathbf{A})である.
\mathbf{(c)}\mathbf{B}が\mathbf{A}に合同であると仮定する. 定義から,n \times n非特異行列\mathbf{P}に対して\mathbf{B}=\mathbf{P}^{\prime} \mathbf{A P}. さらに14.3.5から,
n \times n非特異行列\mathbf{O}とn \times n対角行列\mathbf{D}に対して,\mathbf{A}=\mathbf{Q}^{\prime} \mathbf{D} \mathbf{Q}. したがって,
\mathbf{B}=\mathbf{P}^{\prime} \mathbf{Q}^{\prime} \mathbf{D} \mathbf{Q}=\mathbf{P}_*^{\prime} \mathbf{D} \mathbf{P}_*,
\mathbf{P}_*=\mathbf{Q P}. 明らかに,\mathbf{P}_*は非特異.\mathbf{(a)}と照らし合わせて,\mathbf{B}は\mathbf{A}と同じランクと慣性指数をもつ.
逆に、以下のように仮定します:\mathbf{A}と\mathbf{B}が同じランクrを持ち, 同じ慣性指数mをもつ. すると\mathbf{(b)}から,\mathbf{A}=\mathbf{P}^{\prime} \operatorname{diag}\left(\mathbf{I}_m,-\mathbf{I}_{r-m}, \mathbf{0}\right) \mathbf{P}と\mathbf{B}=\mathbf{Q}^{\prime} \operatorname{diag}\left(\mathbf{I}_m,-\mathbf{I}_{r-m}, \mathbf{0}\right) \mathbf{Q}がn \times n非特異行列\mathbf{P}と\mathbf{Q}にいえる. 従って,
\left(\mathbf{Q}^{\prime}\right)^{-1} \mathbf{B} \mathbf{Q}^{-1}=\operatorname{diag}\left(\mathbf{I}_m,-\mathbf{I}_{r-m}, \mathbf{0}\right)=\left(\mathbf{P}^{-1}\right)^{\prime} \mathbf{A} \mathbf{P}^{-1},
\mathbf{B}=\mathbf{Q}^{\prime}\left(\mathbf{P}^{-1}\right)^{\prime} \mathbf{A} \mathbf{P}^{-1} \mathbf{Q}=\mathbf{P}_*^{\prime} \mathbf{A} \mathbf{P}_* \text {, }
ここで\mathbf{P}_*=\mathbf{P}^{-1} \mathbf{Q}. 明らかに,\mathbf{P}_*は非特異で\mathbf{B}は\mathbf{A}と合同である.
\mathbf{(d)}\mathbf{(b)}から,
\mathbf{A}=\mathbf{P}^{\prime} \operatorname{diag}\left(\mathbf{I}_m,-\mathbf{I}_{r-m}, \mathbf{0}\right) \mathbf{P}
ここで\mathbf{P}はn \times n非特異行列. 14.2.15から\mathbf{A}はm=rのときに限って非負定値でありm=r=nのときに限って正定値である.
系14.2.15. \mathbf{P}をn \times n非特異行列, \mathbf{D}=\left\{d_i\right\}をn \times n対角行列とする. このとき, (1) d_1, \ldots, d_nが非負のときかつそのときに限って, \mathbf{P}^{\prime} \mathbf{DP}は非負定値である. (2) d_1, \ldots, d_nが正のときかつそのときに限って, \mathbf{P}^{\prime} \mathbf{DP}は正定値である. (3) i=1, \ldots, nに対してd_i \geq 0であり, iの少なくとも 1つの値に対して等号が成り立つときかつそのときに限って, \mathbf{P}^{\prime} \mathbf{DP}は半正定値である.
13.
\mathbf{A}を階数rのn \times n対称非負定値行列とする.このとき, 定理14.3.7により,\mathbf{A}=\mathbf{B B}^{\prime}を満たす (階数rの)n \times r行列\mathbf{B}が存在する.\mathbf{X}を\mathbf{A}=\mathbf{X X}^{\prime}を満たす任意,n \times m行列とする (ここでm \geq rとする).
\mathbf{(a)}\mathbf{X}=\mathbf{P}_{\mathbf{B}} \mathbf{X}を示せ.
\mathbf{(b)}ある直交行列\mathbf{Q}に対して\mathbf{X}=(\mathbf{B}, \mathbf{0}) \mathbf{Q}を示せ.
定理 14.3.7.n \times n行列\mathbf{A}(\neq \mathbf{0})は,\mathbf{A}=\mathbf{P}^{\prime} \mathbf{P}を満たす階数rのr \times n行列\mathbf{P}が存在するときかつそのときに限って, 階数rの対称非負定値行列である.
\mathbf{(a)}
系7.4.5 (p.88) より、\mathcal{C}(\mathbf{X}) = \mathcal{C}(\mathbf{A}) = \mathcal{C}(\mathbf{B})。したがって、系12.3.6 (p.199) より、\mathbf{P_{x}} = \mathbf{P_{B}}(ここで、\mathbf{P_{x}} = \mathbf{X}(\mathbf{X}'\mathbf{X})^{-1}\mathbf{X}')。よって、定理12.3.4 (1) (p.196) より、\mathbf{P}_{\mathbf{B}} \mathbf{X} = \mathbf{P}_{\mathbf{X}} \mathbf{X} = \mathbf{X}。
\mathbf{(b)}
系7.4.5 (p.88) より、\mathrm{rank}(\mathbf{B}'\mathbf{B}) = \mathrm{rank}(\mathbf{B}) = rなので、\mathbf{B}'\mathbf{B}は正規行列である。\mathbf{(a)}より、
\mathbf{X} = \mathbf{P}_{\mathbf{B}} \mathbf{X} = \mathbf{B}(\mathbf{B}'\mathbf{B})^{-1}\mathbf{B}'\mathbf{X} \tag{*}.
ここで、\mathbf{Q_1} = (\mathbf{B}'\mathbf{B})^{-1}\mathbf{B}'\mathbf{X}とおく。
\begin{aligned}
\mathbf{Q_1}\mathbf{Q_1}' &= (\mathbf{B}'\mathbf{B})^{-1}\mathbf{B}'\mathbf{X}\mathbf{X}'\mathbf{B}(\mathbf{B}'\mathbf{B})^{-1} \\
&= (\mathbf{B}'\mathbf{B})^{-1}\mathbf{B}'\mathbf{A}\mathbf{B}(\mathbf{B}'\mathbf{B})^{-1} \\
&= (\mathbf{B}'\mathbf{B})^{-1}\mathbf{B}'\mathbf{B B}'\mathbf{B}(\mathbf{B}'\mathbf{B})^{-1} \\
&= \mathbf{I}
\end{aligned}
より、r \times m行列\mathbf{Q_1}は正規直交する。
よって、定理6.4.5 (p.78) より、\mathbf{Q} = (\mathbf{Q_1} \mathbf{Q_2})'が直交行列となるような、(m - r) \times m行列\mathbf{Q_2}が存在する。
上記の\mathbf{Q}に対して、(\mathbf{B}, \mathbf{0}) \mathbf{Q} = \mathbf{B}\mathbf{Q_1}となるが、式(*)より、これは\mathbf{X}に等しい。
14.
もし対称行列\mathbf{A}が非負定値一般逆行列をもつならば,\mathbf{A}は非負定値であることを示せ.
対称行列\mathbf{A}の一般化逆行列を\mathbf{G}と置くと、\mathbf{A}=\mathbf{A G A}=\mathbf{A}^{\prime} \mathbf{G A}である。
定理14.2.9(1)に照らして、(\mathbf{G}が非負定値であるから)上式の最右辺が非負定値であると言える。
定理 14.2.9.\mathbf{A}をn \times n行列,\mathbf{P}をn \times m行列とする. (1) もし\mathbf{A}が非負定値 ならば,\mathbf{P}^{\prime} \mathbf{A P}も非負定値である. (2) もし A が非負定値でかつ\operatorname{rank}(\mathbf{P})<mならば,\mathbf{P}^{\prime} \mathbf{A P}は半正定値である. (3) もし\mathbf{A}が正定値でかつ\operatorname{rank}(\mathbf{P})=mならば,\mathbf{P}^{\prime} \mathbf{A P}は正定値である.
Discussion