行列のルート 【線形代数】

こちらの記事👆で半正定値行列を用いた行列の順序を導入しました

その際に行列に対し\[A\geq O\]という記法を導入しました
これは\(A\)が半正定値であるという意味であるわけです

さて実数の世界では\[a \geq 0\]となっていれば\(\sqrt{a}\)を定義することができたので
行列でも同じように\[\sqrt{A}\quad?\]を定義したいです

ということで半正定値行列に対してそのルートが定義できることを確認したいと思います

半正定値行列のルート

\(n \times n\)半正定値行列\(A\)はそのエルミート性からユニタリ対角化が可能でユニタリ変換の行列を\(U\)とすると\[A = U^* \text{diag}(\lambda_1, \cdots, \lambda_n)U\]とかける.ただし\(\lambda_i\ (i = 1, \cdots, n)\)は固有値.このとき\(\sqrt{A}\)を\[\sqrt{A} := U^*\text{diag}(\sqrt{\lambda_1}, \cdots, \sqrt{\lambda_n})U\]と定義する.

半正定値行列は固有値が非負ですから\(\sqrt{A}\)のユニタリに挟まれた対角行列は問題なく定義できています.

さてではこのように定義した行列のルートがちゃんとルートとして機能しているか確認します
実数のルートと同じように考えると以下の3つが気になります

  1. \(\sqrt{A}\sqrt{A} = A\)
  2. \(\sqrt{A} \geq O \)
  3. 一意性

ではそれぞれ見ていきましょう

\(\sqrt{A}\sqrt{A} = A\)

ユニタリ行列が\(UU^* = I\)となることに注意して計算すると

\begin{align*}
\sqrt{A}\sqrt{A} &= U^*\text{diag}(\sqrt{\lambda_1}, \cdots, \sqrt{\lambda_n})UU^*\text{diag}(\sqrt{\lambda_1}, \cdots, \sqrt{\lambda_n})U \\
&= U^* \text{diag}(\lambda_1, \cdots, \lambda_n)U \\
&= A
\end{align*}

\(\sqrt{A} \geq O \)

半正定値の定義を確認するため二次形式を作ってみると,

\begin{align*}
x^* \sqrt{A} x &= x^* U^*\text{diag}(\sqrt{\lambda_1}, \cdots, \sqrt{\lambda_n})Ux \\
&= \|\text{diag}(\sqrt[4]{\lambda_1}, \cdots, \sqrt[4]{\lambda_n}) Ux\|^2 \\
&\geq 0
\end{align*}

一意性

最後に一意性ですね

\(\sqrt{A}\)として二つの行列\(B,C\)がとれたとします.つまり行列\(B, C\)がともに\[B^2 = A,\ B \geq O\]\[C^2 = A,\ C \geq O\]という\(\sqrt{A}\)の条件を満たしている場合に,\(B = C\)を導きます.

今\(B,C\)はともに半正定値なのでエルミートですから,\(B -C\)はエルミートでユニタリ対角化できます.もし固有値がすべて\(0\)だとしたら\(B =C\)ですね.よって\(B -C\)がゼロでない固有値を持つと仮定して背理法で示します.

さてではこのゼロでない固有値を\(\lambda\)としてその固有ベクトルを\(v\)としてみましょう.\[(B-C)v = \lambda v\]です.ここで今から\(v\)による二次形式を調べるのですが,\[v^* BC v = v^* CB v\]となることに注意します.これは

\begin{align*}
v^* BC v &= v^* B(B -\lambda I) v \\
&= v^* (B -\lambda I) B v \\
&= ((B -\lambda I) v)^* B v \\
&= (C v)^* B v\\
&= v^* C B v
\end{align*}

となることからわかります.これを用いると二次形式の中では行列が交換できるので,和と差の積公式みたいな手続きで以下のように変形することができます.

\begin{align*}
v^* (B^2 -C^2) v &= v^* (B+C)(B-C) v \\
&= \lambda v^* (B+C) v \\
&= \lambda (v^* Bv + v^* C v)
\end{align*}

一方\(B^2 = C^2 = A\)ですから,\[v^* (B^2 -C^2) v= 0\]ですね.よって\[v^* Bv =-v^* C v\]となります.ところで\(B,C\)は半正定値ですから.\[0 \leq v^* Bv =-v^* C v \leq 0\]となり\[v^* Bv = v^* C v = 0\]です.すると\((B-C)v = \lambda v\)を思い出せば\[0 = v^* (B-C)v = \lambda \|v \|^2\]となりますが,今固有値は非ゼロで固有ベクトルは\(0\)でないので矛盾します.よって\(B=C\)しかありえないことがわかりました.

よって\(\sqrt{A}\)を定義する際にはユニタリ行列を使った形で書きましたが,それがルートの性質を満たす唯一の表現であることが確かめられましたので,半正定値行列のルートはもとの行列をユニタリ対角化して対角行列の部分だけルートとることで求められることがわかりました.

ぶつぶつり
ぶつぶつり

最後までお読みいただきありがとうございました

コメント

タイトルとURLをコピーしました