3 minute read

๋ณต์ˆ˜์ „๊ณตํ•˜๊ณ  ์žˆ๋Š” ์ˆ˜ํ•™๊ณผ์˜ ํ•™๋ถ€ ์กธ์—…์‹œํ—˜์„ ์œ„ํ•ด 2024๋…„ 10์›”๋ถ€ํ„ฐ ์„ ํ˜•๋Œ€์ˆ˜๋ฅผ ๋‹ค์‹œ ๊ณต๋ถ€ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. (ํ˜„์žฌ์ง„ํ–‰ํ˜•โ€ฆ ๐Ÿƒโ€โ™‚๏ธโ€โžก๏ธ) ์„ ํ˜•๋Œ€์ˆ˜์— ๋Œ€ํ•œ ์ „์ฒด ํฌ์ŠคํŠธ ๋ชฉ๋ก์€ โ€œLinear Algebraโ€œ์—์„œ ํ™•์ธํ•˜์‹ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค!

๋“ค์–ด๊ฐ€๋ฉฐ

์ด ๋ถ€๋ถ„์€ ๋ญ”๊ฐ€ ๊ณ ๋“ฑํ•™๊ต ๋•Œ ๋ฐฐ์šด โ€œ๊ธฐํ•˜์™€ ๋ฒกํ„ฐโ€์˜ ๋А๋‚Œ์ด ์กฐ๊ธˆ ๋‚˜๋Š” ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค ใ…‹ใ…‹

๊ทธ๋Ÿฐ๋ฐ, ์ˆ˜๋Šฅ ์ดํ›„๋กœ ๊ณ ๊ต ์ˆ˜ํ•™์€ ๋‹ค์‹œ ํŽด๋ณธ ์ ์ด ํ•œ๋ฒˆ๋„ ์—†์–ด์„œ ใ…‹ใ…‹ ๋ฐฐ์› ๋˜ ํ•˜๋‚˜๋„ ๊ธฐ์–ต ์•ˆ ๋‚˜๊ธด ํ•œ๋‹คโ€ฆ ๐Ÿ˜ตโ€๐Ÿ’ซ

Projection on a vector

geeksforgeeks

์–ด๋–ค ๋ฒกํ„ฐ $\mathbf{b}$๋ฅผ ๋‹ค๋ฅธ ๋ฒกํ„ฐ $\mathbf{a}$ ๋ฐฉํ–ฅ์œผ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ฒƒ ์ž…๋‹ˆ๋‹ค. ํ‘œ๊ธฐ๋Š” ์•„๋ž˜์™€ ๊ฐ™์Šต๋‹ˆ๋‹ค.

\[\text{proj}_{\mathbf{a}}{\mathbf{b}} = \text{proj}_{\mathbf{a}}(\mathbf{b})\]

๋ฒกํ„ฐ $\mathbf{b}$๋ฅผ ์ •์‚ฌ์˜ํ•œ ๊ฒƒ์€ ๋ฒกํ„ฐ $\mathbf{a}$์— ์Šค์นผ๋ผ ๋ฐฐ์ˆ˜ ํ•œ ๊ฒƒ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ,

\[\text{proj}_{\mathbf{a}}(\mathbf{b}) = c \cdot \mathbf{a}\]

์ด๋•Œ, ๋ฒกํ„ฐ $\mathbf{a}$์™€ ์ •์‚ฌ์˜ ๋ฒกํ„ฐ $c \cdot \mathbf{b}$๋ฅผ ๋นผ์ฃผ๋ฉด, ์ด๊ฒƒ์€ ์ •์‚ฌ์˜์˜ ์ •์˜์— ์˜ํ•ด ์ถ•์ด ๋˜๋Š” ๋ฒกํ„ฐ $\mathbf{b}$์™€ ์ˆ˜์งํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

\[(\mathbf{b} - c \cdot \mathbf{a}) \cdot \mathbf{a} = 0\]

์ด์ œ ์‹์„ ์ •๋ฆฌํ•˜๋ฉด,

\[c = \frac{\mathbf{b} \cdot \mathbf{a}}{\vert \mathbf{a} \vert^2}\]

๋”ฐ๋ผ์„œ, ์ •์‚ฌ์˜ ๋ฒกํ„ฐ์˜ ์ตœ์ข… ํ˜•ํƒœ๋Š”

\[\text{proj}_{\mathbf{a}}(\mathbf{b}) = \frac{\mathbf{b} \cdot \mathbf{a}}{\vert \mathbf{a} \vert^2} \cdot \mathbf{a}\]

Projection on a subspace

์ด๋ฒˆ์—๋Š” ๋ฒกํ„ฐ $\mathbf{b}$๋ฅผ ํ‰๋ฉด(๊ณต๊ฐ„) $W$ ์œ„์— ์ •์‚ฌ์˜ ํ•ด๋ด…์‹œ๋‹ค. ์ด๊ฒƒ์€ ํ•ด๋‹น ํ‰๋ฉด(๊ณต๊ฐ„) $W$ ์•ˆ์— ์žˆ๋Š” ๋ฒกํ„ฐ ์ค‘ ๊ฐ€์žฅ ๋ฒกํ„ฐ๋ฅผ ์ฐพ๋Š” ๊ฒƒ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. ํ‘œ๊ธฐ๋Š” ์•„๋ž˜์™€ ๊ฐ™์Šต๋‹ˆ๋‹ค.

\[\text{proj}_{W}{\mathbf{b}} = \text{proj}_{W}(\mathbf{b})\]

ํ‰๋ฉด ์œ„์— ์ •์‚ฌ์˜ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ฐพ๊ธฐ ์œ„ํ•ด ํ‰๋ฉด์ด ์–ด๋–ป๊ฒŒ ๋งŒ๋“ค์–ด์ง€๋Š”์ง€ ์ฐพ์•„์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋ณดํ†ต์€ ํ–‰๋ ฌ $A$๊ฐ€ ๋จผ์ € ์ฃผ์–ด์ง€๊ณ , ์ด๊ฒƒ์˜ ์—ด๋ฒกํ„ฐ๋กœ ํ‰๋ฉด $W$๋ฅผ ๋งŒ๋“ค๊ธด ํ•˜๋Š”๋ฐ, ๋ฐ˜๋Œ€๋กœ ํ‰๋ฉด $W$๊ฐ€ ์ฃผ์–ด์กŒ๋‹ค๋ฉด,

\[W = \text{span}(\mathbf{a}_1, \mathbf{a}_2, \dots, \mathbf{a}_k)\]

์ž„์„ ์ด์šฉํ•ด ํ–‰๋ ฌ $A \in \mathbf{R}^{n\times k}$๋ฅผ ๋งŒ๋“ค์–ด๋‚ด๋ฉด ๋ฉ๋‹ˆ๋‹ค.


์ด์ œ ์‹ค์ œ ์ •์‚ฌ์˜์„ ์ฐพ์•„๋ด…์‹œ๋‹ค! ๊ฐ€์žฅ ๋จผ์ €, ๋ฒกํ„ฐ $\mathbf{b}$๋ฅผ $W$ ์œ„๋กœ ์ •์‚ฌ์˜ํ•˜๋ฉด, ๊ทธ ์ •์‚ฌ์˜๋œ ๋ฒกํ„ฐ $\mathbf{p}$๋Š” ํ‰๋ฉด $W$์— ์†ํ•˜๊ฒŒ ๋˜๊ณ  ์ด๊ฒƒ์€

\[\text{proj}_{W}(\mathbf{b}) = \mathbf{p} \in W\]

๊ทธ๋ฆฌ๊ณ  ์ •์‚ฌ์˜ ๋ฒกํ„ฐ $\mathbf{p}$๋Š” ์—ด๊ณต๊ฐ„ $\text{Col}(A)$์— ์†ํ•˜๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ, ์ •์‚ฌ์˜ ๋ฒกํ„ฐ๋ฅผ ์•„๋ž˜์™€ ๊ฐ™์ด ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

\[\mathbf{p} = A \hat{\mathbf{x}}\]


์ด์ œ, ์˜ค์ฐจ ๋ฒกํ„ฐ๋ฅผ ์ •์˜ ํ•ฉ๋‹ˆ๋‹ค.

\[\mathbf{e} = \mathbf{b} - \mathbf{p} = \mathbf{b} - A \hat{\mathbf{x}}\]

์ด ์˜ค์ฐจ๋Š” ํ‰๋ฉด $W = \text{Col}(A)$์™€ ์ง๊ต ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ,

\[A^T \mathbf{e} = A^T (\mathbf{b} - A \hat{\mathbf{x}}) = \mathbf{0}\]

์ด์ œ, ์ด ์‹์„ ์ž˜ ์ •๋ฆฌํ•ด์„œ $\hat{\mathbf{x}}$๋ฅผ ๊ตฌํ•˜๋ฉด,

\[\hat{\mathbf{x}} = (A^T A)^{-1} A^T \mathbf{b}\]

์ด์ œ ์ฒ˜์Œ์— ์ •์˜ ํ–ˆ๋˜, ์ •์‚ฌ์˜ ๋ฒกํ„ฐ $\mathbf{p}$์˜ ์ •์˜์— ๋Œ€์ž…ํ•˜๋ฉด,

\[\text{proj}_{W}(\mathbf{b}) = A (A^T A)^{-1} A^T \mathbf{b}\]

Projection Matrix

์œ„์—์„œ ์ˆ˜ํ–‰ํ•œ ํ‰๋ฉด์œผ๋กœ์˜ ์ •์‚ฌ์˜ $\text{proj}_W(\mathbf{b})$๋ฅผ ์ˆ˜ํ–‰ํ•ด์ฃผ๋Š” ํ•จ์ˆ˜ ๊ฐ™์€ ํ–‰๋ ฌ์„ ์ •์˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ โ€œ์ •์‚ฌ์˜ ํ–‰๋ ฌโ€œ์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

ํ–‰๋ ฌ ์ž์ฒด๋Š” ๊ทธ๋ƒฅ ์œ„์—์„œ ์œ ๋„ํ•œ ์ •์‚ฌ์˜ ๊ณต์‹์—์„œ ๊ฐ€์ ธ์˜ค๋ฉด ๋ฉ๋‹ˆ๋‹ค.

\[P = A (A^T A)^{-1} A^T\]

์ด ์ •์‚ฌ์˜ ํ–‰๋ ฌ์€ ๋ช‡๊ฐ€์ง€ ํŠน์ง•์ด ์žˆ๋Š”๋ฐ์š”!

  • ๋Œ€์นญ์„ฑ
    • ์ •์‚ฌ์˜์€ ๋Œ€์นญ ์—ฐ์‚ฐ์ด๊ธฐ ๋•Œ๋ฌธ์—, ํ–‰๋ ฌ๋„ ์ด๋ฅผ ๋ฐ˜์˜ ํ•ฉ๋‹ˆ๋‹ค.
    • $P^T = P$
  • ๋ฉฑ๋“ฑ์„ฑ
    • ์ •์‚ฌ์˜์„ 2๋ฒˆ ์ด์ƒ ์ง„ํ–‰ํ•ด๋„, ์ฒ˜์Œ ์‚ฌ์˜ํ•œ ๊ฒฐ๊ณผ์—์„œ ๋ฐ”๋€Œ์ง€ ์•Š์Šต๋‹ˆ๋‹ค.
    • ๋”ฐ๋ผ์„œ, $P^n = P^2 = P$