Projection
๋ณต์์ ๊ณตํ๊ณ ์๋ ์ํ๊ณผ์ ํ๋ถ ์กธ์ ์ํ์ ์ํด 2024๋ 10์๋ถํฐ ์ ํ๋์๋ฅผ ๋ค์ ๊ณต๋ถํ๊ณ ์์ต๋๋ค. (ํ์ฌ์งํํโฆ ๐โโ๏ธโโก๏ธ) ์ ํ๋์์ ๋ํ ์ ์ฒด ํฌ์คํธ ๋ชฉ๋ก์ โLinear Algebraโ์์ ํ์ธํ์ค ์ ์์ต๋๋ค!
๋ค์ด๊ฐ๋ฉฐ
์ด ๋ถ๋ถ์ ๋ญ๊ฐ ๊ณ ๋ฑํ๊ต ๋ ๋ฐฐ์ด โ๊ธฐํ์ ๋ฒกํฐโ์ ๋๋์ด ์กฐ๊ธ ๋๋ ๊ฒ ๊ฐ์ต๋๋ค ใ ใ
๊ทธ๋ฐ๋ฐ, ์๋ฅ ์ดํ๋ก ๊ณ ๊ต ์ํ์ ๋ค์ ํด๋ณธ ์ ์ด ํ๋ฒ๋ ์์ด์ ใ ใ ๋ฐฐ์ ๋ ํ๋๋ ๊ธฐ์ต ์ ๋๊ธด ํ๋คโฆ ๐ตโ๐ซ
Projection on a vector
์ด๋ค ๋ฒกํฐ $\mathbf{b}$๋ฅผ ๋ค๋ฅธ ๋ฒกํฐ $\mathbf{a}$ ๋ฐฉํฅ์ผ๋ก ๋ณํํ๋ ๊ฒ ์ ๋๋ค. ํ๊ธฐ๋ ์๋์ ๊ฐ์ต๋๋ค.
๋ฒกํฐ $\mathbf{b}$๋ฅผ ์ ์ฌ์ํ ๊ฒ์ ๋ฒกํฐ $\mathbf{a}$์ ์ค์นผ๋ผ ๋ฐฐ์ ํ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค. ๋ฐ๋ผ์,
\[\text{proj}_{\mathbf{a}}(\mathbf{b}) = c \cdot \mathbf{a}\]์ด๋, ๋ฒกํฐ $\mathbf{a}$์ ์ ์ฌ์ ๋ฒกํฐ $c \cdot \mathbf{b}$๋ฅผ ๋นผ์ฃผ๋ฉด, ์ด๊ฒ์ ์ ์ฌ์์ ์ ์์ ์ํด ์ถ์ด ๋๋ ๋ฒกํฐ $\mathbf{b}$์ ์์งํ๊ฒ ๋ฉ๋๋ค.
\[(\mathbf{b} - c \cdot \mathbf{a}) \cdot \mathbf{a} = 0\]์ด์ ์์ ์ ๋ฆฌํ๋ฉด,
\[c = \frac{\mathbf{b} \cdot \mathbf{a}}{\vert \mathbf{a} \vert^2}\]๋ฐ๋ผ์, ์ ์ฌ์ ๋ฒกํฐ์ ์ต์ข ํํ๋
Projection on a subspace
์ด๋ฒ์๋ ๋ฒกํฐ $\mathbf{b}$๋ฅผ ํ๋ฉด(๊ณต๊ฐ) $W$ ์์ ์ ์ฌ์ ํด๋ด ์๋ค. ์ด๊ฒ์ ํด๋น ํ๋ฉด(๊ณต๊ฐ) $W$ ์์ ์๋ ๋ฒกํฐ ์ค ๊ฐ์ฅ ๋ฒกํฐ๋ฅผ ์ฐพ๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค. ํ๊ธฐ๋ ์๋์ ๊ฐ์ต๋๋ค.
ํ๋ฉด ์์ ์ ์ฌ์ํ๋ ๋ฐฉ๋ฒ์ ์ฐพ๊ธฐ ์ํด ํ๋ฉด์ด ์ด๋ป๊ฒ ๋ง๋ค์ด์ง๋์ง ์ฐพ์์ผ ํฉ๋๋ค. ๋ณดํต์ ํ๋ ฌ $A$๊ฐ ๋จผ์ ์ฃผ์ด์ง๊ณ , ์ด๊ฒ์ ์ด๋ฒกํฐ๋ก ํ๋ฉด $W$๋ฅผ ๋ง๋ค๊ธด ํ๋๋ฐ, ๋ฐ๋๋ก ํ๋ฉด $W$๊ฐ ์ฃผ์ด์ก๋ค๋ฉด,
\[W = \text{span}(\mathbf{a}_1, \mathbf{a}_2, \dots, \mathbf{a}_k)\]์์ ์ด์ฉํด ํ๋ ฌ $A \in \mathbf{R}^{n\times k}$๋ฅผ ๋ง๋ค์ด๋ด๋ฉด ๋ฉ๋๋ค.
์ด์ ์ค์ ์ ์ฌ์์ ์ฐพ์๋ด ์๋ค! ๊ฐ์ฅ ๋จผ์ , ๋ฒกํฐ $\mathbf{b}$๋ฅผ $W$ ์๋ก ์ ์ฌ์ํ๋ฉด, ๊ทธ ์ ์ฌ์๋ ๋ฒกํฐ $\mathbf{p}$๋ ํ๋ฉด $W$์ ์ํ๊ฒ ๋๊ณ ์ด๊ฒ์
\[\text{proj}_{W}(\mathbf{b}) = \mathbf{p} \in W\]๊ทธ๋ฆฌ๊ณ ์ ์ฌ์ ๋ฒกํฐ $\mathbf{p}$๋ ์ด๊ณต๊ฐ $\text{Col}(A)$์ ์ํ๊ธฐ๋ ํฉ๋๋ค. ๋ฐ๋ผ์, ์ ์ฌ์ ๋ฒกํฐ๋ฅผ ์๋์ ๊ฐ์ด ํํํ ์ ์์ต๋๋ค.
\[\mathbf{p} = A \hat{\mathbf{x}}\]์ด์ , ์ค์ฐจ ๋ฒกํฐ๋ฅผ ์ ์ ํฉ๋๋ค.
\[\mathbf{e} = \mathbf{b} - \mathbf{p} = \mathbf{b} - A \hat{\mathbf{x}}\]์ด ์ค์ฐจ๋ ํ๋ฉด $W = \text{Col}(A)$์ ์ง๊ต ํด์ผ ํฉ๋๋ค. ๋ฐ๋ผ์,
\[A^T \mathbf{e} = A^T (\mathbf{b} - A \hat{\mathbf{x}}) = \mathbf{0}\]์ด์ , ์ด ์์ ์ ์ ๋ฆฌํด์ $\hat{\mathbf{x}}$๋ฅผ ๊ตฌํ๋ฉด,
\[\hat{\mathbf{x}} = (A^T A)^{-1} A^T \mathbf{b}\]์ด์ ์ฒ์์ ์ ์ ํ๋, ์ ์ฌ์ ๋ฒกํฐ $\mathbf{p}$์ ์ ์์ ๋์ ํ๋ฉด,
Projection Matrix
์์์ ์ํํ ํ๋ฉด์ผ๋ก์ ์ ์ฌ์ $\text{proj}_W(\mathbf{b})$๋ฅผ ์ํํด์ฃผ๋ ํจ์ ๊ฐ์ ํ๋ ฌ์ ์ ์ํ ์ ์์ต๋๋ค. ์ด๋ฅผ โ์ ์ฌ์ ํ๋ ฌโ์ด๋ผ๊ณ ํฉ๋๋ค.
ํ๋ ฌ ์์ฒด๋ ๊ทธ๋ฅ ์์์ ์ ๋ํ ์ ์ฌ์ ๊ณต์์์ ๊ฐ์ ธ์ค๋ฉด ๋ฉ๋๋ค.
\[P = A (A^T A)^{-1} A^T\]์ด ์ ์ฌ์ ํ๋ ฌ์ ๋ช๊ฐ์ง ํน์ง์ด ์๋๋ฐ์!
- ๋์นญ์ฑ
- ์ ์ฌ์์ ๋์นญ ์ฐ์ฐ์ด๊ธฐ ๋๋ฌธ์, ํ๋ ฌ๋ ์ด๋ฅผ ๋ฐ์ ํฉ๋๋ค.
- $P^T = P$
- ๋ฉฑ๋ฑ์ฑ
- ์ ์ฌ์์ 2๋ฒ ์ด์ ์งํํด๋, ์ฒ์ ์ฌ์ํ ๊ฒฐ๊ณผ์์ ๋ฐ๋์ง ์์ต๋๋ค.
- ๋ฐ๋ผ์, $P^n = P^2 = P$