6 minute read

๋ณต์ˆ˜์ „๊ณตํ•˜๊ณ  ์žˆ๋Š” ์ˆ˜ํ•™๊ณผ์˜ ํ•™๋ถ€ ์กธ์—…์‹œํ—˜์„ ์œ„ํ•ด 2024๋…„ 10์›”๋ถ€ํ„ฐ ์„ ํ˜•๋Œ€์ˆ˜๋ฅผ ๋‹ค์‹œ ๊ณต๋ถ€ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. (ํ˜„์žฌ์ง„ํ–‰ํ˜•โ€ฆ ๐Ÿƒโ€โ™‚๏ธโ€โžก๏ธ) ์„ ํ˜•๋Œ€์ˆ˜์— ๋Œ€ํ•œ ์ „์ฒด ํฌ์ŠคํŠธ ๋ชฉ๋ก์€ โ€œLinear Algebraโ€œ์—์„œ ํ™•์ธํ•˜์‹ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค!

๋“ค์–ด๊ฐ€๋ฉฐ

์ด์ฐจ ํ˜•์‹์„ ๊ฐ„๋‹จํžˆ ์„ค๋ช…ํ•˜๋ฉด, โ€œ์ด์ฐจ์‹โ€์„ ํ–‰๋ ฌ์˜ ํ˜•ํƒœ๋กœ ํ‘œํ˜„ํ•˜๋Š” ๊ฒƒ์„ ๋งํ•ฉ๋‹ˆ๋‹ค.

์˜ˆ๋ฅผ ๋“ค์–ด, ์•„๋ž˜์™€ ๊ฐ™์€ ์ด์ฐจ์‹์ด ์žˆ์„ ๋•Œ,

\[3 x^2 + 2 xy + 4 y^2\]

์ด๊ฒƒ์„ ํ–‰๋ ฌ๋กœ ํ‘œํ˜„ํ•˜๋ฉด,

\[\left[\begin{matrix} x & y \end{matrix}\right] \left[\begin{matrix} 3 & 1 \\ 1 & 4 \\ \end{matrix}\right] \left[\begin{matrix} x \\ y \\ \end{matrix}\right]\]

์‹ ๊ธฐํ•˜์ฃ ? ๊ทธ๋ž˜์„œ ์ด๋ ‡๊ฒŒ ํ–‰๋ ฌ๋กœ ํ‘œํ˜„ํ•œ ์ด์ฐจ์‹์„ ์•„๋ž˜์™€ ๊ฐ™์ด ํ‘œํ˜„ํ•˜๋Š” ๊ฒƒ์„ โ€œQuadratic Formโ€์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

\[Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x}\]

์ด๋•Œ, ์ด์ฐจ ํ˜•์‹์„ ์ด๋ฃจ๋Š” ํ–‰๋ ฌ $A$๋Š” ๋ฐ˜๋“œ์‹œ โ€œ๋Œ€์นญ ํ–‰๋ ฌโ€œ์ด์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค!

Diagonalizing the Quadratic Form

์ด์ „์— โ€œ๋Œ€๊ฐํ™”โ€์™€ โ€œ์ง๊ต-๋Œ€๊ฐํ™”โ€์— ๋Œ€ํ•ด์„œ ์‚ดํŽด๋ณด์•˜๋˜ ๊ฒƒ์„ ๊ธฐ์–ตํ•˜๋‚˜์š”?

\[A = P D P^{-1} \quad \text{or} \quad A = P D P^T\]

๊ทธ๋ฆฌ๊ณ  ํ–‰๋ ฌ $A$๊ฐ€ ๋Œ€์นญ ํ–‰๋ ฌ์ด๋ผ๋ฉด, โ€œ์ŠคํŽ™ํŠธ๋Ÿด ์ •๋ฆฌโ€œ์— ์˜ํ•ด ์ง๊ต-๋Œ€๊ฐํ™”๊ฐ€ ๊ฐ€๋Šฅํ–ˆ๊ณ , ๋ชจ๋“  ๊ณ ์œ ๊ฐ’์€ ์‹ค์ˆ˜๊ฐ’์„ ๊ฐ€์ง‘๋‹ˆ๋‹ค.


์ด์ฐจํ˜•์‹์€ โ€œ๋Œ€์นญ ํ–‰๋ ฌโ€์— ๋Œ€ํ•ด์„œ๋งŒ ์„ฑ๋ฆฝํ•˜๊ธฐ ๋•Œ๋ฌธ์—, ์ด ์„ฑ์งˆ์„ ๋ฐ”ํƒ•์œผ๋กœ โ€œ์ด์ฐจ ํ˜•์‹์˜ ๊ฐ„์†Œํ™”โ€œ๋ฅผ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค!

๋ฐ”๋กœ ์‚ดํŽด๋ด…์‹œ๋‹ค.

\[\begin{aligned} Q(\mathbf{x}) &= \mathbf{x}^T A \mathbf{x} \\ &= \mathbf{x}^T (P D P^T) \mathbf{x} \\ &= (\mathbf{x}^T P) \, D \, (P^T \mathbf{x}) \end{aligned}\]

์—ฌ๊ธฐ์—์„œ $\mathbf{y} = P^T \mathbf{x}$๋กœ ๋ณ€์ˆ˜ ์น˜ํ™˜์„ ํ•˜๋ฉด, ์•„๋ž˜์™€ ๊ฐ™๊ณ ,

\[Q(\mathbf{x}) = \mathbf{y}^T D \mathbf{y}\]

์œ„์˜ ์‹์„ ์ „๊ฐœํ•˜๋ฉด,

\[Q(\mathbf{x}) = \lambda_1 y_1^2 + \cdots + \lambda_n y_n^2\]

๊ฐ€ ๋ฉ๋‹ˆ๋‹ค! ์ •๋ง ์‰ฝ์ฃ ?!

Principal Axis Theorem

์ด์ฐจํ˜•์‹์„ ๋Œ€๊ฐํ™” ํ•˜์—ฌ ๊ฐ„์†Œํ™” ํ•œ ์ง€๊ธˆ๊นŒ์ง€์˜ ๊ณผ์ •์€ ์‚ฌ์‹ค โ€œ์ฃผ์ถ• ์ •๋ฆฌโ€์ž…๋‹ˆ๋‹ค ใ…‹ใ…‹

์–ด๋–ค ์‹ค์ˆ˜ ๋Œ€์นญ ํ–‰๋ ฌ $A$์— ๋Œ€ํ•ด์„œ, ์ง๊ต ํ–‰๋ ฌ $P$๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ,

๊ทธ๊ฒƒ์˜ ์ด์ฐจ ํ˜•์‹ $Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x}$๋ฅผ ๊ต์ฐจํ•ญ ์—†๋Š”, ๋Œ€๊ฐ ํ˜•ํƒœ๋กœ ๋ฐ”๊ฟ€ ์ˆ˜ ์žˆ๋‹ค.

ํ–‰๋ ฌ $A$์˜ ์ด์ฐจ ํ˜•์‹์€ $\mathbf{x} = [x_1, x_2, \dots, x_n]^T$ ๋ณ€์ˆ˜๋ฅผ ๊ธฐ์ค€์œผ๋กœ ์ž‘์„ฑ ๋ฉ๋‹ˆ๋‹ค. ์ด๊ฒƒ์„ ๋Œ€๊ฐํ™” ํ•˜๋ฉด, ๊ฐ’๋“ค์ด ์ฃผ์ถ•(Principal Axis) ๋ฐฉํ–ฅ์˜ ์ขŒํ‘œ๊ณ„๋กœ ์ •๋ ฌ(=ํšŒ์ „) ํ•ฉ๋‹ˆ๋‹ค. ์ด๋•Œ, ์ฃผ์ถ•์€ ๊ณ ์œ  ๋ฒกํ„ฐ์˜ ๋ชจ์Œ ์ž…๋‹ˆ๋‹ค(๋Œ€๊ฐํ™” ํ–‰๋ ฌ $P$)!

์ฆ‰, ๊ธฐ์กด์˜ ์ด์ฐจ์‹์„ ๋Œ€๊ฐํ™”๋ฅผ ํ†ตํ•ด ๊ณ ์œ  ๋ฒกํ„ฐ๋ผ๋Š” ์ฃผ์ถ• ๋ฐฉํ–ฅ์œผ๋กœ ๋ณ€ํ™˜ ํ•˜๊ณ , ์ด๋ฅผ ํ†ตํ•ด ์‹์„ ๊ฐ€์žฅ ๋‹จ์ˆœํ•œ ํ˜•ํƒœ๋กœ ๋งŒ๋“ค์–ด ์ค๋‹ˆ๋‹ค.

Positive/Negative Definite

์ด์ฐจํ˜•์‹ $Q(x)$์„ ํ‘œํ˜„ํ•  ๋•Œ ํ–‰๋ ฌ์„ ์‚ฌ์šฉํ•˜์ง€๋งŒ, ์‚ฌ์‹ค ๊ทธ ๊ฐ’์€ ์‹ค์ˆ˜๊ฐ’ ์ž…๋‹ˆ๋‹ค! (์ด์ฐจ์‹์—์„œ ๋‚˜์™”์œผ๋‹ˆ๊นŒ ๋‹น์—ฐ ใ…‹ใ…‹)

\[Q(\mathbf{x}) \in \mathbb{R}\]

์ด์ฐจํ˜•์‹์€ $Q(\mathbf{x})$ ์ผ์ข…์˜ ํ•จ์ˆ˜์ด๊ธฐ ๋•Œ๋ฌธ์—, ์ž…๋ ฅ๋˜๋Š” $\mathbf{x}$์˜ ๊ฐ’์— ๋”ฐ๋ผ์„œ, ๊ฐ๊ฐ ๋‹ค๋ฅธ ๊ฐ’์ด ๋‚˜์˜ฌ ๊ฒƒ ์ž…๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์ฒ˜์Œ ์˜ˆ์‹œ ์‚ฌ์šฉํ•œ $A$๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋Š” ์ด์ฐจ ํ˜•์‹์€

\[Q([0, 0]^T) = 0, \quad Q([1, 1]^T) = 9\]

์ด๋•Œ, ์–ด๋–ค ์ด์ฐจ์‹(์ด์ฐจํ˜•์‹)์€ ์–ด๋–ค $\mathbf{x} \ne \mathbf{0}$์„ ๋„ฃ์–ด๋„ ๊ทธ ๊ฐ’์ด ์–‘์ˆ˜๊ฐ€ ๋‚˜์˜ค๊ฑฐ๋‚˜, ์Œ์ˆ˜๊ฐ€ ๋‚˜์˜ค๋Š” ๊ฒฝ์šฐ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค! ์„ ํ˜•๋Œ€์ˆ˜์—์„œ๋Š” ์ด๋Ÿฐ ๊ฒฝ์šฐ์— ๋Œ€ํ•ด โ€œPositive Definite(์˜์˜ ์ •๋ถ€ํ˜ธ)โ€๋ผ๊ณ  ๋ถ„๋ฅ˜ ํ•ฉ๋‹ˆ๋‹ค.

Positive Definite when for all $\mathbf{x} \ne \mathbf{0}$,

\[Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} > 0\]

โ€œํ–‰๋ ฌ $A$๊ฐ€ Positive Definite๋‹คโ€, ๋˜๋Š” โ€œ์ด์ฐจํ˜•์‹์ด Positive Definite๋‹คโ€๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค. (๋‘˜๋‹ค ์ƒ๊ด€ x) Negative Definite๋Š” ๋ฐ˜๋Œ€๋กœ ์–ด๋–ค ๊ฐ’์ด ์ž…๋ ฅ ๋˜๋˜์ง€ ์ƒ๊ด€ ์—†์ด ์Œ์ˆ˜๊ฐ€ ๋‚˜์˜ค๋Š” ๊ฒฝ์šฐ๋ฅผ ๋งํ•ฉ๋‹ˆ๋‹ค.
(์‚ฌ์‹ค Positive Definite $Q(\mathbf{x}) > 0$์ธ $A$์— $-1$์„ ๊ณฑํ•ด์ฃผ๋ฉด, ๋ฐ”๋กœ Negative Definite๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.)


ํ–‰๋ ฌ $A$๊ฐ€ Positive Definite ๋˜๋ ค๋ฉด ์•„๋ž˜์˜ ์กฐ๊ฑด์„ ๋งŒ์กฑํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

  • ํ–‰๋ ฌ $A$๊ฐ€ ์ •์‚ฌ๊ฐ ํ–‰๋ ฌ์ด๊ณ ,
  • ํ–‰๋ ฌ $A$๊ฐ€ ๋Œ€๊ฐํ™” ๊ฐ€๋Šฅํ•ด์•ผ ํ•˜๊ณ ,
  • ํ–‰๋ ฌ $A$๊ฐ€ ๋Œ€์นญ ํ–‰๋ ฌ์ด๊ณ ,
    • = ์ง๊ต-๋Œ€๊ฐํ™” ๊ฐ€๋Šฅ
  • ํ–‰๋ ฌ $A$์˜ ๋ชจ๋“  ๊ณ ์œ ๊ฐ’์ด ์–‘์ˆ˜์—ฌ์•ผ ํ•จ.

๊ฒฐ๊ตญ, ํ–‰๋ ฌ $A$๊ฐ€ Positive Definite ์ธ์ง€ ํŒ๋‹จํ•˜๋ ค๋ฉด ๊ท€์ฐฎ๊ฒŒ ์ด์ฐจํ˜•์‹ $Q(\mathbf{x})$๋ฅผ ๋งŒ๋“ค์–ด์„œ ์ง€์ง€๊ณ  ๋ณถ๊ณ  ํ•  ๊ฒƒ ์—†์ด ๊ณ ์œ ๊ฐ’์˜ ๋ถ€ํ˜ธ๋งŒ ์ฒดํฌํ•˜๋ฉด ๋œ๋‹ค๋Š” ๊ฒƒ ์ž…๋‹ˆ๋‹ค! ๐Ÿ˜ฒ

Semi-definite, and Indefinite

์ด์ฐจ ํ˜•์‹์˜ ๊ฐ’์ด ํ•ญ์ƒ ์–‘์ˆ˜๊ฐ€ ์•„๋‹ˆ๋ผ 0์„ ํฌํ•จํ•˜์—ฌ ์–‘์ˆ˜๊ฐ€ ๋  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

Positive semi-definite when for all $\mathbf{x} \ne \mathbf{0}$,

\[Q(\mathbf{x}) {\color{red} \ge} 0\]

์ด๋Ÿฐ ๊ฒฝ์šฐ๋ฅผ โ€œPositive semi-definiteโ€(์–‘์˜ ๋ฐ˜์ •๋ถ€ํ˜ธ)๋ผ๊ณ  ํ•˜๋ฉฐ, ์ด๋•Œ๋Š” ๋ชจ๋“  ๊ณ ์œ ๊ฐ’์ด $\lambda_i \ge 0$์ธ ๊ฒฝ์šฐ์— ์ด๋ ‡๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. semi-definite์ผ ๋•Œ๋Š” ์–ด๋–ค ๋ฒกํ„ฐ๋ฅผ ์ž˜ ๊ณ ๋ฅด๋ฉด, $Q(\mathbf{x}) = 0$๊ฐ€ ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.


๋งˆ์ง€๋ง‰์œผ๋กœ ๊ณ ์œ ๊ฐ’์ด ํ•œ ๋ฐฉํ–ฅ์œผ๋กœ ์ •๋ ฌ๋˜์ง€ ์•Š๊ณ , ์–‘์ˆ˜/์Œ์ˆ˜๊ฐ€ ๋‘˜๋‹ค ์กด์žฌํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๊ฒฝ์šฐ๋Š” โ€œIndefiniteโ€๋ผ๊ณ  ๋ถ„๋ฅ˜ ํ•ฉ๋‹ˆ๋‹ค.

Indefinite when

for some $\mathbf{x}_1 \ne \mathbf{0}$,

\[Q(\mathbf{x}_1) > 0\]

and for some $\mathbf{x}_2 \ne \mathbf{0}$,

\[Q(\mathbf{x}_2) < 0\]

Geometric Interpretation

์š” ๋ถ€๋ถ„๋„ ์ด์ฐจ ํ˜•์‹์—์„œ ์ค‘์š”ํ•œ ํŒŒํŠธ์ด๊ธด ํ•œ๋ฐโ€ฆ ์ด์ œ ์ข€ ์ง€์ณ์„œ ์Šคํ‚ต ํ•˜๊ฒ ์Šต๋‹ˆ๋‹คโ€ฆ ใ…‹ใ…‹

๋งบ์Œ๋ง

ํ•™๋ถ€ ์ˆ˜์—… ๋•Œ, ์ฒ˜์Œ ์ด์ฐจ ํ˜•์‹์„ ๋งŒ๋‚ฌ์„ ๋•Œ๋Š” ์ž˜ ์ดํ•ด๊ฐ€ ์•ˆ ๋˜๋Š” ํŒŒํŠธ ์˜€์Šต๋‹ˆ๋‹ค! ๊ทธ๋ž˜๋„ ๋‹น์‹œ์— ์–ด์˜๋ถ€์˜ ์—ด์‹ฌํžˆ ์ธํ„ฐ๋„ท์„ ๋’ค์ ธ๊ฐ€๋ฉด์„œ ์ดํ•ดํ•ด๋ณด๋ ค๊ณ  ๋…ธ๋ ฅ ํ–ˆ๋˜ ๊ธฐ์–ต์ด ๋‚˜๋Š”๋ฐ์š” ใ…‹ใ…‹ ๋‹ค์‹œ ๋Œ์•„์™€์„œ ์ด ๋ถ€๋ถ„์„ ๋ณด๋‹ˆ๊นŒ ์˜›๋‚  ์ƒ๊ฐ์ด ๋ฌธ๋“ ๋‚ฌ๋„ค์š” ใ…Žใ…Ž