Rank-Nullity Theorem
๋ค์ด๊ฐ๋ฉฐ
<Rank-Nullity Theorem>์ ์ ํ ๋์ํ์ ์ค์ํ ์ ๋ฆฌ์ธ <Fundamental Theorem of Linear Algebra>์ ์ ๋ฆฌ ์ค ํ๋๋ค. ์ ๋ฆฌ์ ์ ํ ๋์์ ํต์ฌ๊ณผ ์ ์๋ฅผ ๋ด๊ณ ์๋ค.
Rank-Nullity Theorem์ ๋ฐ๋ก ๋ณด๋ ๊ฑด ์๋๊ณ , ๋ช๊ฐ์ง ์ค๊ฐ ์ ๋ฆฌ๋ค์ ๋จผ์ ์ดํด๋ณด์. ์๋์ ์ ์๋๋ ์ ๋ฆฌ๋ค๋ ์ด๋ค ์๋ฏธ๋ฅผ ๊ฐ๋์ง ์ดํดํ ํ์๊ฐ ์๋ค.
Column Rank = Row Rank
The row space $\mathcal{R}(A)$ and column space $\mathcal{C}(A)$ of a matrix $A$ have the same dimension.
\[\dim (\mathcal{C}(A)) = \dim (\mathcal{R}(A))\]ํ๋ ฌ $A$์์ row์ column์ ์ ๋ง ๋ณ๊ฐ์ ์กด์ฌ๋ค. ์๋ฌด ๊ด๋ จ๋ ์๋ ๋์ด ์ ๊ธฐํ๊ฒ๋ ํ๊ณต๊ฐ๊ณผ ์ด๊ณต๊ฐ์ ์ฐจ์์ด ๊ฐ๋ค๊ณ ํ๋ค!!
์ฆ๋ช ์ 2๊ฐ์ง ๋ฒ์ ์ผ๋ก ์งํํด๋ณด๊ฒ ๋ค. ํ๋๋ Elementary Row Operation์ผ๋ก ์ป์ Row-Echelon Form์์ ๊ด์ฐฐํ ํน์ฑ์ ๋ฐํ์ผ๋ก ํ๊ณ , ํ๋๋ Orthogonality๋ฅผ ์ด์ฉํ๋ค.
Row-Echelon Form
ํ๋ ฌ $A \in \mathbb{R}^{m\times n}$๊ฐ ์๋ค๊ณ ํ์. ์ด ํ๋ ฌ์ $m$๊ฐ ํ๊ณผ $n$๊ฐ ์ด์ ๊ฐ๋๋ค.
์ด ํ๋ ฌ์ Elementary Row Operation์ ์ ์ ํ ์ํํด Row Echelon Form(์ดํ REF)๋ก ๋ง๋ค ์ ์์ ๊ฒ์ด๋ค.
\[\left[ \begin{array}{ccccc} 1 & a_0 & a_1 & a_2 & a_3 \\ 0 & 0 & 2 & a_4 & a_5 \\ 0 & 0 & 0 & 1 & a_6 \\ 0 & 0 & 0 & 0 & 0 \end{array} \right]\]์๋ฐ $4 \times 5$ ํ๋ ฌ์ด๋ผ๊ณ ํ๋ฉด, pivot 1, 2, 1์ด ์๋ ํ์ด basis๋ฅผ ์ด๋ฃฌ๋ค.
์ฌ๊ธฐ์์ ์กฐ๊ธ๋ง ๋ Elementary Row Operation์ ์ํํ๋ฉด, ๋ ์ฌํํด์ง reduced ํํ์ REF๋ฅผ ์ป์ ์ ์๋ค.
\[\left[ \begin{array}{ccccc} 1 & a_0 & 0 & 0 & a_3 \\ 0 & 0 & 2 & 0 & a_5 \\ 0 & 0 & 0 & 1 & a_6 \\ 0 & 0 & 0 & 0 & 0 \end{array} \right]\]์ฌ์ค pivot ์์ ๊ฐ๋ค์ด ์์ด์ก์ ๋ฟ์ด๋ค ใ ใ ์ด ์ํ์์ ํ๋ ฌ์ ์ด๊ณต๊ฐ์ ๊ด์ ์ผ๋ก ๋ณด๋ฉด, pivot์ด ์๋ ๊ทธ ์ด์ด ๊ทธ๋๋ก ์ด๊ณต๊ฐ์ basis๋ฅผ ์ด๋ฃฌ๋ค.
๋ฐ๋ผ์, ํ๊ณต๊ฐ๊ณผ ์ด๊ณต๊ฐ์ basis ๊ฐฏ์๊ฐ ๊ฐ์ผ๋ฏ๋ก, ๋ ๊ณต๊ฐ์ ์ฐจ์(dimension)์ด ๊ฐ๋ค. $\blacksquare$
Orthogonality
์ฆ๋ช ์ ์์ํ๊ธฐ ์ ์, Wikipedia - Rank(linear algebra)์ ์ฆ๋ช ์ ์ฐธ๊ณ ํ๊ณ ๋ค๋ฌ์์์ ๋ฐํ๋ค.
ํ๋ ฌ $A \in \mathbb{R}^{m\times n}$๊ฐ ์๋ค๊ณ ํ์. ์ด ํ๋ ฌ์ $m$๊ฐ ํ๊ณผ $n$๊ฐ ์ด์ ๊ฐ๋๋ค. ๊ทธ๋ฆฌ๊ณ $r$์ ํ๊ณต๊ฐ $\mathcal{R}(A)$์ dimension์ด๋ผ๊ณ ํ์.
๊ทธ๋ฌ๋ฉด, $r$๊ฐ์ basis๋ฅผ $\mathcal{R}(A)$์์ ์ ์ํ ์ ์๋ค. ์ด๋ฅผ $\mathbf{x}_1, \mathbf{x}_2, \dots, \mathbf{x}_r \in \mathbb{R}^{n}$๋ผ๊ณ ํ์.
์ฐ๋ฆฌ๋ ํ๋ ฌ $A$์ ํ basis๋ฅผ ๊ณฑํ ๊ฒ๋ค, $A \mathbf{x}_1, A \mathbf{x}_2, \dots, A \mathbf{x}_r \in \mathbb{R}^{m}$์ด ์๋ก ์ผ์ฐจ ๋ ๋ฆฝ์ธ์ง ํ์ธํ๊ณ ์ ํ๋ค.
์ด๋ฅผ ํ์ธํ๊ณ ์ $A \mathbf{x}_i$ ๋ฒกํฐ๋ค์ ์ผ์ฐจ ๊ฒฐํฉํ ๊ฐ์ด ์๋ฒกํฐ๊ฐ ๋ ๋์ ๊ณ์ $c_i$๊ฐ ์ด๋ป๊ฒ ๋๋์ง ์ดํด๋ณด์.
\[c_1 A \mathbf{x}_1 + c_2 A \mathbf{x}_2 + \cdots + c_r A \mathbf{x}_r = \mathbf{0}\]๊ทธ๋ฆฌ๊ณ ์์ ์์ ์ ์ ๋ฆฌํด $\mathbf{v}$๋ผ๋ ์ผ์ฐจ๊ฒฐํฉ์ผ๋ก ๋ง๋ค์ด์ง ๋ฒกํฐ๋ฅผ ์ด๋ฆ๋ถ์ธ๋ค.
\[\mathbf{v} = c_1 \mathbf{x}_1 + \cdots c_r \mathbf{x}_r\]๊ทธ๋ฌ๋ฉด ์์ ์ ๋ฆฌํด ์๋์ ๊ฐ์ด ๋๋ค.
\[A \mathbf{v} = \mathbf{0}\]์ผ๋จ ์์ $A \mathbf{v} = \mathbf{0}$์ 2๊ฐ์ง ์๋ฏธ๋ฅผ ๊ฐ๋๋ค.
- ๋ฒกํฐ $\mathbf{v}$๊ฐ $A$์ ๋ชจ๋ ํ๊ณผ ์ง๊ต(orthogonal)ํ๋ค.
- $A \mathbf{v} = \mathbf{0}$์ด ๋๋ ค๋ฉด, ๊ฐ ํ๊ณผ ๋ด์ ํ ๊ฐ์ด 0์ด ๋์ด์ผ ํ๊ธฐ ๋๋ฌธ
- ๋ฒกํฐ $\mathbf{v}$๊ฐ ํ basis์ ์ผ์ฐจ ๊ฒฐํฉ์ด๊ธฐ ๋๋ฌธ์, $A$์ ํ๊ณต๊ฐ์ ๋ค์ ์ํ๋ ๋ฒกํฐ๋ค. 1๋ฒ์ ์ฌ์ค์ ๋ฒกํฐ $\mathbf{v}$๊ฐ ์๊ธฐ ์์ ๊ณผ๋ ์ง๊ต ํ๋ค๋ ๊ฒ์ ๋งํ๋ค.
1๋ฒ, 2๋ฒ์ ์ฌ์ค์ ์ํด $\mathbf{v} = \mathbf{0}$๋ผ๋ ๊ฒฐ๋ก ์ด ๋์จ๋ค. (์๊ธฐ ์์ ๊ณผ ์ง๊ตํ๋ค๋ ๊ฑด ์๋ฒกํฐ์์ ์๋ฏธํ๋ค.) ๋ฐ๋ผ์, ํ basis์ ๋ํด ์๋ ์์ด ์ฑ๋ฆฝํ๋ค.
\[c_1 \mathbf{x}_1 + c_2 \mathbf{x}_2 + \cdots + c_r \mathbf{x}_r = \mathbf{0}\]๊ทธ๋ฐ๋ฐ, $\mathbf{x}_i$๋ ํ๊ณต๊ฐ์ basis์ด๋ฏ๋ก ์์ ์ผ์ฐจ๊ฒฐํฉ ์์ด ์ฑ๋ฆฝํ๋ ค๋ฉด, ๋ชจ๋ ๊ณ์๊ฐ $0$์ด ๋์ด์ผ ํ๋ค.
์ฒ์์ โ$A \mathbf{x}_i$ ๋ฒกํฐ๋ค์ ์ผ์ฐจ ๊ฒฐํฉโํ ๊ฒ์ ๊ณ์๋ ๋ง์ฐฌ๊ฐ์ง๋ก $0$์ด ๋๋ค๋ ๊ฒ์ ๋งํ๋ฉฐ, $A \mathbf{x}_i$ ๋ฒกํฐ๋ค์ด ๋ชจ๋ ์ผ์ฐจ ๋ ๋ฆฝ์์ ๋งํ๋ค.
$A \mathbf{x}_i$ ๋ฒกํฐ๋ค์ด ๋ชจ๋ ์ผ์ฐจ ๋ ๋ฆฝ์ธ ๊ฒ์ ํ์ธํ์ผ๋ฏ๋ก, ์ค์ ์ด๊ณต๊ฐ์ basis ๊ฐฏ์๋ $r$๋ณด๋ค ํฌ๊ฑฐ๋ ๊ฐ์ ๊ฒ์ด๋ค. ๋ฐ๋ผ์ ์๋ ์์ด ์ฑ๋ฆฝํ๋ค.
\[\dim (\mathcal{R}(A)) = r \le \dim (\mathcal{C}(A))\]์ด ๊ณผ์ ์ $A^{T}$์๋ ๋์ผํ๊ฒ ์ํํ๋ฉด, ์๋์ ์์ ์ป๋๋ค.
\[\dim (\mathcal{R}(A)) \ge \dim (\mathcal{C}(A))\]๋ฐ๋ผ์, ๋ ๋ถ๋ฑ์์ ์ํด
\[\dim (\mathcal{R}(A)) = \dim (\mathcal{C}(A))\]$\blacksquare$
์ ์ฆ๋ช ์ ๊ธฐ๋ณธํ์ฐ์ฐ์ผ๋ก ์ ๋ํ๋ ์ฆ๋ช ๋ณด๋ค ์ข ์ด๋ ค์ด ๋๋์ด์๋ค. ๊ทธ๋์ ์ฆ๋ช ์ ๋ค์ ์ฝ์์ ๋, ์ดํด๊ฐ ๋๋ฌด ์ ๋์ด์ ํ๋ฒ ๋ค์ ๋ค๋ฌ๊ธฐ๋ ํ๋ค ใ ใ
๊ทธ๋๋ ์์ง ์ดํด๊ฐ ์ ๋๋ ๊ฒ์ $A \mathbf{x}_i \in \mathcal{C}(A)$์ ์ดํด๊ฐ ์ ์ ๋๋ ๊ฒ ๊ฐ๋ค.
Rank-Nullity Theorem: Rank + Nullity = $n$
For any $A \in \mathbb{R}^{m \times n}$,
\[\dim (\mathcal{R}(A)) + \dim (\mathcal{N}(A)) = n\](1) Supp. $\text{rank}(A) = n$, then the only solution for $A \mathbf{x} = 0$ is $\mathbf{x} = 0$ ($\because$ All rows are linearly independent.)
Therefore, nullity $\dim (\mathcal{N}(A)) = 0$, and given equation holds.
(2) Supp. $\text{rank}(A) = r < n$.
Then $\exists$ $n-r$ free variables in the solution of $A \mathbf{x} = 0$.
Then, we can easily get $n-r$ number of vectors in $\mathcal{N}(A)$, by one-hot at position of only one free variable. These $n-r$ number of vectors are linearly independent. Also, these forms null space of $A$!! Therefore, $\dim (\mathcal{N}(A)) = n-r$.
Thus,
\[\text{rank}(A) + \dim (\mathcal{N}(A)) = r + (n-r) = n\]$\blacksquare$