μ„ ν˜• λ³€ν™˜μ—μ„œ λ³΄μ‘΄λ˜λŠ” 정보/차원(Rank)κ³Ό μ†μ‹€λœ 정보/차원(Nullity)의 관계λ₯Ό λ§ν•˜λŠ” μ„ ν˜• λŒ€μˆ˜μ˜ κΈ°λ³Έ 정리. 그리고 μ„ ν˜•λ³€ν™˜μ—μ„œ 행곡간과 μ—΄κ³΅κ°„μ˜ 관계에 λŒ€ν•΄. μ „ν˜€ 관련이 μ—†μ–΄ λ³΄μ΄λŠ” 두 곡간은 같은 차원은 κ°€μ§„λ‹€!

9 minute read

λ³΅μˆ˜μ „κ³΅ν•˜κ³  μžˆλŠ” μˆ˜ν•™κ³Όμ˜ ν•™λΆ€ μ‘Έμ—…μ‹œν—˜μ„ μœ„ν•΄ 2024λ…„ 10μ›”λΆ€ν„° μ„ ν˜•λŒ€μˆ˜λ₯Ό λ‹€μ‹œ κ³΅λΆ€ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€. (ν˜„μž¬μ§„ν–‰ν˜•β€¦ πŸƒβ€β™‚οΈβ€βž‘οΈ) μ„ ν˜•λŒ€μˆ˜μ— λŒ€ν•œ 전체 포슀트 λͺ©λ‘μ€ β€œLinear Algebraβ€œμ—μ„œ ν™•μΈν•˜μ‹€ 수 μžˆμŠ΅λ‹ˆλ‹€!

λ“€μ–΄κ°€λ©°

<Rank-Nullity Theorem>은 μ„ ν˜• λŒ€μˆ˜ν•™μ˜ μ€‘μš”ν•œ 정리인 <Fundamental Theorem of Linear Algebra>의 정리 쀑 ν•˜λ‚˜λ‹€. 정리에 μ„ ν˜• λŒ€μˆ˜μ˜ 핡심과 μ •μˆ˜λ₯Ό λ‹΄κ³  μžˆλ‹€.

Rank-Nullity Theorem을 λ°”λ‘œ λ³΄λŠ” 건 μ•„λ‹ˆκ³ , λͺ‡κ°€μ§€ 쀑간 정리듀을 λ¨Όμ € μ‚΄νŽ΄λ³΄μž. μ•„λž˜μ— μ œμ‹œλ˜λŠ” 정리듀도 μ–΄λ–€ 의미λ₯Ό κ°–λŠ”μ§€ 이해할 ν•„μš”κ°€ μžˆλ‹€.

Row space and Column Space have same dimension

The row space $\mathcal{R}(A)$ and column space $\mathcal{C}(A)$ of a matrix $A$ have the same dimension.

\[\dim (\mathcal{C}(A)) = \dim (\mathcal{R}(A))\]

ν–‰λ ¬ $A$μ—μ„œ row와 column은 정말 λ³„κ°œμ˜ μ‘΄μž¬λ‹€. κ·Έλƒ₯ ν–‰λ ¬μ΄λΌμ„œ λͺ¨μ—¬ μžˆμ„ 뿐인 두 곡간이 μ‹ κΈ°ν•˜κ²Œλ„ 차원이 κ°™λ‹€κ³  ν•œλ‹€!!

증λͺ…을 2κ°€μ§€ λ²„μ „μœΌλ‘œ 진행해보겠닀. ν•˜λ‚˜λŠ” Elementary Row Operation으둜 얻은 Row-Echelon Formμ—μ„œ κ΄€μ°°ν•œ νŠΉμ„±μ„ λ°”νƒ•μœΌλ‘œ ν•˜κ³ , ν•˜λ‚˜λŠ” Orthogonalityλ₯Ό μ΄μš©ν•œλ‹€.

Row-Echelon Form

ν–‰λ ¬ $A \in \mathbb{R}^{m\times n}$κ°€ μžˆλ‹€κ³  ν•˜μž. 이 행렬은 $m$개 ν–‰κ³Ό $n$개 열을 κ°–λŠ”λ‹€.

이 행렬을 Elementary Row Operation을 적절히 μˆ˜ν–‰ν•΄ Row Echelon Form(μ΄ν•˜ REF)둜 λ§Œλ“€ 수 μžˆμ„ 것이닀.

\[\left[ \begin{array}{ccccc} {\color{red} 1} & a_{12} & a_{13} & a_{14} & a_{15} \\ 0 & 0 & {\color{red} 2} & a_{24} & a_{25} \\ 0 & 0 & 0 & {\color{red} 1} & a_{35} \\ 0 & 0 & 0 & 0 & 0 \end{array} \right]\]

μš”λŸ° $4 \times 5$ 행렬이라고 ν•˜λ©΄, pivot 1, 2, 1이 μžˆλŠ” 행이 basisλ₯Ό 이룬닀.

μ—¬κΈ°μ—μ„œ 쑰금만 더 Elementary Row Operation을 μˆ˜ν–‰ν•˜λ©΄, 더 μ‹¬ν”Œν•΄μ§„ reduced ν˜•νƒœμ˜ REFλ₯Ό 얻을 수 μžˆλ‹€.

\[\left[ \begin{array}{ccccc} {\color{red} 1} & a'_{12} & 0 & 0 & a'_{15} \\ 0 & 0 & {\color{red} 2} & 0 & a'_{25} \\ 0 & 0 & 0 & {\color{red} 1} & a_{35} \\ 0 & 0 & 0 & 0 & 0 \end{array} \right]\]

사싀 pivot μœ„μ˜ 값듀이 μ—†μ–΄μ‘Œμ„ 뿐이닀 γ…‹γ…‹ 이 μƒνƒœμ—μ„œ 행렬을 μ—΄κ³΅κ°„μ˜ κ΄€μ μœΌλ‘œ 보면, pivot이 μžˆλŠ” κ·Έ 열이 κ·ΈλŒ€λ‘œ μ—΄κ³΅κ°„μ˜ basisλ₯Ό 이룬닀.

λ”°λΌμ„œ, 행곡간과 μ—΄κ³΅κ°„μ˜ basis κ°―μˆ˜κ°€ κ°™μœΌλ―€λ‘œ, 두 κ³΅κ°„μ˜ 차원(dimension)이 κ°™λ‹€. $\blacksquare$

Orthogonality

Wikipedia의 Rank(linear algebra)의 증λͺ…을 μ°Έκ³ ν•˜κ³  λ‹€λ“¬μ—ˆμŒμ„ λ°νžŒλ‹€.

ν–‰λ ¬ $A \in \mathbb{R}^{m\times n}$κ°€ μžˆλ‹€κ³  ν•˜μž. 이 행렬은 $m$개 ν–‰κ³Ό $n$개 열을 κ°–λŠ”λ‹€.

그리고 $r$을 행곡간 $\mathcal{R}(A)$의 dimension이라고 ν•˜μž. 그러면, $r$개의 basisλ₯Ό μ •μ˜ν•  수 μžˆλ‹€. 이λ₯Ό $\mathbf{x}_1, \mathbf{x}_2, \dots, \mathbf{x}_r \in \mathcal{R}(A) \subseteq \mathbb{R}^{n}$라고 ν•˜μž.

ν–‰λ ¬ $A$에 ν–‰ basisλ₯Ό κ³±ν•œ 것듀은 $A \mathbf{x}_1, A \mathbf{x}_2, \dots, A \mathbf{x}_r \in \mathcal{C}(A) \subseteq \mathbb{R}^{m}$, κ²°κ³Ό 벑터가 열곡간에 μ†ν•©λ‹ˆλ‹€.
(μ²˜μŒμ— μ™œ 열곡간에 μ†ν•˜λŠ”μ§€κ°€ ν—·κ°ˆλ ΈλŠ”λ°, $A \mathbf{x}_i$λŠ” $n$개 μ—΄λ²‘ν„°μ˜ μ„ ν˜• 결합을 ν•˜λŠ” 것이기 λ•Œλ¬Έμ—, κ·Έ κ²°κ³Όκ°€ 열곡간 $\mathcal{C}(A)$에 μ†ν•©λ‹ˆλ‹€.)

λ§Œμ•½ $A\mathbf{x}_i$ 열벑터듀이 μ„œλ‘œ μ„ ν˜• λ…λ¦½μž„μ„ 보일 수 μžˆλ‹€λ©΄, μ—΄κ³΅κ°„μ˜ 차원이 μ΅œμ†Œν•œ ν–‰κ³΅κ°„μ˜ 차원 $r$λ³΄λ‹€λŠ” ν¬κ±°λ‚˜ κ°™λ‹€λŠ” 것을 μ˜λ―Έν•©λ‹ˆλ‹€. 즉, $\dim (\mathcal{C}(A)) \ge r = \dim (\mathcal{R}(A))$.

그리고 같은 과정을 λ°˜λŒ€λ‘œ $A^T$에 λŒ€ν•΄μ„œλ„ μ μš©ν•˜λ©΄, λ°˜λŒ€μ˜ 뢀등식 $\dim (\mathcal{C}(A)) \le \dim (\mathcal{R}(A))$λ₯Ό μ–»κ³ , μ΅œμ’…μ μœΌλ‘œ $\dim (\mathcal{C}(A)) \ge r = \dim (\mathcal{R}(A))$인 κ²°κ³Όλ₯Ό μ–»μŠ΅λ‹ˆλ‹€.


μ—΄κ³΅κ°„μ˜ 벑터가 된 $A \mathbf{x}_i$듀이 μ„ ν˜• 독립인지 ν™•μΈν•΄λ΄…μ‹œλ‹€. λ§Œμ•½, μ„ ν˜• 독립이라면 $r$개의 μ„ ν˜• 독립인 벑터λ₯Ό μ°Ύμ•˜μœΌλ―€λ‘œ μ—΄κ³΅κ°„μ˜ 차원은 적어도 $r$λ³΄λ‹€λŠ” ν½λ‹ˆλ‹€.
(λ“±ν˜Έ $=$κ°€ μ•„λ‹ˆλΌ $\ge$κ°€ λ˜λŠ” μ΄μœ λŠ” 열곡간에 $A \mathbf{x}_i$둜 μœ λ„λ˜μ§€ μ•ŠλŠ” κΈ°μ €κ°€ μ‘΄μž¬ν•  수 있기 λ•Œλ¬Έμž…λ‹ˆλ‹€.)

μ„ ν˜• 독립을 ν™•μΈν•˜κΈ° μœ„ν•΄, μ„ ν˜• 결합이 μ˜λ²‘ν„°κ°€ 될 λ•Œμ˜ κ³„μˆ˜ $c_i$κ°€ μ–΄λ–»κ²Œ λ˜λŠ”μ§€ μ‚΄νŽ΄λ΄…μ‹œλ‹€.

\[c_1 A \mathbf{x}_1 + c_2 A \mathbf{x}_2 + \cdots + c_r A \mathbf{x}_r = \mathbf{0}\]

μœ„μ˜ μ„ ν˜• λ…λ¦½μ˜ 식을 잘 μ •λ¦¬ν•˜λ©΄, $A \mathbf{v} = \mathbf{0}$κ°€ λ˜λŠ”, $\mathbf{v}$λ₯Ό μ •μ˜ν•  수 μžˆμŠ΅λ‹ˆλ‹€. $\mathbf{v}$λŠ” $\mathbf{x}_i$의 μ„ ν˜•κ²°ν•©μœΌλ‘œ λ§Œλ“€μ–΄μ§„ 벑터 μž…λ‹ˆλ‹€.

\[\mathbf{v} = c_1 \mathbf{x}_1 + \cdots c_r \mathbf{x}_r\]
  1. $A \mathbf{v} = \mathbf{0}$λΌλŠ” 것은 벑터 $\mathbf{v}$κ°€ $A$의 λͺ¨λ“  ν–‰κ³Ό 직ꡐ(orthogonal) ν•©λ‹ˆλ‹€.
    • $A \mathbf{v} = \mathbf{0}$이 되렀면, 각 ν–‰κ³Ό λ‚΄μ ν•œ 값이 0이 λ˜μ–΄μ•Ό ν•˜κΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€.
  2. λͺ¨λ“  ν–‰κ³Ό μ§κ΅ν•œλ‹€λŠ” 것은, 행곡간 $\mathcal{R}(A)$ 전체와 μ§κ΅ν•œλ‹€λŠ” 것을 λ§ν•©λ‹ˆλ‹€.
  3. 벑터 $\mathbf{v}$λŠ” ν–‰ basis의 μ„ ν˜• 결합이기 λ•Œλ¬Έμ—, λ‹€μ‹œ $A$의 행곡간에 μ†ν•˜λŠ” 벑터 μž…λ‹ˆλ‹€.
  4. λ”°λΌμ„œ, $\mathbf{v}$λŠ” 자기 μžμ‹ κ³Όλ„ 직ꡐ ν•΄μ•Ό ν•©λ‹ˆλ‹€!
    • 자기 μžμ‹ λ„ 행곡간에 μ†ν•˜λŠ” 벑터이기 λ•Œλ¬Έμž…λ‹ˆλ‹€.

결둠인 4λ²ˆμ—μ„œ β€œμžκΈ° μžμ‹ κ³Ό μ§κ΅β€œν•œλ‹€λŠ” 건 μ˜λ²‘ν„°μž„μ„ μ˜λ―Έν•©λ‹ˆλ‹€. λ”°λΌμ„œ, $\mathbf{v} = \mathbf{0}$μž…λ‹ˆλ‹€.

\[\mathbf{v} = c_1 \mathbf{x}_1 + c_2 \mathbf{x}_2 + \cdots + c_r \mathbf{x}_r = \mathbf{0}\]

그런데, $\mathbf{x}_i$λŠ” ν–‰κ³΅κ°„μ˜ basisμ΄λ―€λ‘œ, 기저에 λŒ€ν•œ μ •μ˜μ— μ˜ν•΄ λͺ¨λ“  κ³„μˆ˜ $c_i$κ°€ $0$이 λ˜μ–΄μ•Ό ν•©λ‹ˆλ‹€.

이것은 $A \mathbf{x}_i$ μ‚¬μ΄μ˜ μ„ ν˜• 독립을 ν™•μΈν•˜κΈ° μœ„ν•΄ μ²˜μŒμ— μ„Έμ› λ˜ 식에 λŒ€ν•΄μ„œ,

\[c_1 A \mathbf{x}_1 + c_2 A \mathbf{x}_2 + \cdots + c_r A \mathbf{x}_r = \mathbf{0}\]

$r$개 열벑터 $A \mathbf{x}_i$κ°€ μ„œλ‘œ μ„ ν˜• λ…λ¦½μž„μ„ λ§ν•©λ‹ˆλ‹€!


$r$개 열벑터 $A \mathbf{x}_i$κ°€ μ„ ν˜• 독립인 것을 ν™•μΈν–ˆκ³ , μ‹€μ œ μ—΄κ³΅κ°„μ˜ κΈ°μ € κ°―μˆ˜λŠ” $r$보닀 ν¬κ±°λ‚˜ 같을 것 μž…λ‹ˆλ‹€. (μš°λ¦¬κ°€ λ°œκ²¬ν•˜μ§€ λͺ»ν•œ κΈ°μ €κ°€ λ‚¨μ•˜μ„ 수 있기 λ•Œλ¬Έμž…λ‹ˆλ‹€.) λ”°λΌμ„œ μ•„λž˜ 식이 μ„±λ¦½ν•©λ‹ˆλ‹€.

\[\dim (\mathcal{R}(A)) = r \le \dim (\mathcal{C}(A))\]

이 과정을 $A^{T}$에도 λ™μΌν•˜κ²Œ μˆ˜ν–‰ν•˜λ©΄, μ•„λž˜μ˜ 식을 μ–»μŠ΅λ‹ˆλ‹€.

\[\dim (\mathcal{R}(A)) \ge \dim (\mathcal{C}(A))\]

λ”°λΌμ„œ, 두 뢀등식에 μ˜ν•΄

\[\dim (\mathcal{R}(A)) = \dim (\mathcal{C}(A))\]

$\blacksquare$

μš” 증λͺ…은 κΈ°λ³Έν–‰μ—°μ‚°μœΌλ‘œ μœ λ„ν•˜λŠ” 증λͺ…보닀 쒀더 κΈΈκ³ , μ„ ν˜•λŒ€μˆ˜μ— λŒ€ν•œ λ‹¨λ‹¨ν•œ 이해가 ν•„μš”ν•©λ‹ˆλ‹€. 저도 μ²˜μŒμ— 이 증λͺ…을 적고, 잘 이해가 μ•ˆ λ˜μ–΄μ„œ λͺ‡ λ²ˆμ”© 고쳐 μ μ€κ²Œ μ§€κΈˆμ˜ ν˜•νƒœ μž…λ‹ˆλ‹€.

μ†μœΌλ‘œ 직접 증λͺ…을 μ¨λ‚΄λ €κ°€λ©΄μ„œ 읡히고, 각 κ³Όμ •μ˜ 의미λ₯Ό κ³±μ”ΉμœΌλ©΄μ„œ μ΄ν•΄ν•˜λ©΄, 정리도 이해할 수 있고 μ„ ν˜•λŒ€μˆ˜μ— λŒ€ν•œ 이해도 더 κΉŠμ–΄μ§€λŠ” 그런 쒋은 정리 μž…λ‹ˆλ‹€ γ…Žγ…Ž

Rank-Nullity Theorem: Rank + Nullity = $n$

For any $A \in \mathbb{R}^{m \times n}$,

\[\dim (\mathcal{R}(A)) + \dim (\mathcal{N}(A)) = n\]

(1) Supp. $\text{rank}(A) = n$, then the only solution for $A \mathbf{x} = 0$ is $\mathbf{x} = 0$ ($\because$ All rows are linearly independent.)

Therefore, nullity $\dim (\mathcal{N}(A)) = 0$, and given equation holds.

(2) Supp. $\text{rank}(A) = r < n$.

Then $\exists$ $n-r$ free variables in the solution of $A \mathbf{x} = 0$.

Then, we can easily get $n-r$ number of vectors in $\mathcal{N}(A)$, by one-hot at position of only one free variable. These $n-r$ number of vectors are linearly independent. Also, these forms null space of $A$!! Therefore, $\dim (\mathcal{N}(A)) = n-r$.

Thus,

\[\text{rank}(A) + \dim (\mathcal{N}(A)) = r + (n-r) = n\]

$\blacksquare$