Splines Method (2)
2021-1ํ๊ธฐ, ๋ํ์์ โํต๊ณ์ ๋ฐ์ดํฐ๋ง์ด๋โ ์์ ์ ๋ฃ๊ณ ๊ณต๋ถํ ๋ฐ๋ฅผ ์ ๋ฆฌํ ๊ธ์ ๋๋ค. ์ง์ ์ ์ธ์ ๋ ํ์์ ๋๋ค :)
์ด ํฌ์คํธ๋ Regression Spline๊ณผ ์ด์ด์ง๋ ๋ด์ฉ์ ๋๋ค ๐
Non-parameteric Logistic Regression
๋ณธ๋ <Binary Logistic Regreeion>์ ์๋์ ๊ฐ์ด ๋ชจ๋ธ๋งํ๋ค.
\[\log \frac{P(Y = 1 \mid X=x)}{P(Y = 0 \mid X=x)} = \beta^T x\]์์ ์์ ๋ค์ ์ ์ ๋ฆฌํ๋ฉด ์๋์ ๊ฐ๋ค.
\[P(Y = 1 \mid X = x) = \frac{e^{\beta^T x}}{1 + e^{\beta^T x}}\]<Non-parametric (binary) logistic regression>์ ์์ ์์์ $\beta^T x$๋ฅผ $f(x)$๋ก ๋์ฒดํ๋ค!!
\[P(Y = 1 \mid X = x) = \frac{e^{f(x)}}{1 + e^{f(x)}}\]์ด๋, $f(x)$๋ ํ์ฌ ๋ชจ๋ฅด๋ ์ํ๋ก ์ฐ๋ฆฌ๊ฐ estimation ํด์ผ ํ๋ ๋์์ด๋ค!!
์ ๊ท ์์ ์์๋ $f(\cdot)$๋ฅผ ์ถ์ ํ๋ ๋ฐฉ์์ผ๋ก ์๋์ โpenalized log-likelihood functionโ์ Maximize ํ๋ ๊ฒ์ ์ ์ํ๋ค.
\[\ell_\lambda (f) = \sum^n_{i=1} \left[ y_i f(x_i) - \log (1 + e^{f(x_i)}) \right] - \frac{\lambda}{2} \int \left\{ f''(t) \right\}^2 \; dt\]๋ณต์กํ๊ฒ ์๊ฐํ๊ธฐ ๋ณด๋ค๋ <smoothing spline>๊ณผ ๋น์ทํ ํํ๋ผ๊ณ ์ธ์ ํด๋์!
Multi-dimensional Splines
์ง๊ธ๊น์ง ์ดํด๋ณธ <Spline Method>๋ ๋ชจ๋ 1-dimensional spline model์ด์๋ค. ํ์ง๋ง, ๋ง์ ๊ฒฝ์ฐ feature์ ์ํธ์์ฉ์ ๊ณ ๋ คํ๋ multi-dimensionalํ ์ ๊ทผ์ ํ์๋ก ํ๋ค.
<Multi-dimensional Spline>์ ์๋์ ๊ฐ์ด ๋ชจ๋ธ๋ง ํ๋ค.
\[f(X) = \sum^{M_1}_{i=1} \sum^{M_2}_{j=1} \; \theta_{ij} \cdot g_{ij} (X)\]where $g_{ij}(X)$ is the tensor product of basis function, defined by
\[g_{ij}(X) = h_{1i} (X_1) \cdot h_{2j} (X_2)\]์ฆ, โmulti-dimensional splineโ์ ๋ basis spline์ ๊ณฑํ ๊ฒ์ basis function์ผ๋ก ์ผ๋๋ค๋ ๋ง์ด๋ค!
์์ ๊ฐ์ ๋ฐฉ์์ผ๋ก ์ ๊ทผํ๋ฉด, 2-dim ๋ฟ๋ง ์๋๋ผ d-dim๊น์ง๋ ์ฝ๊ฒ generalization ํ ์ ์๋ค.
๊ทธ๋ฌ๋ input variable์ ์ $d$๊ฐ ์ฆ๊ฐํ๋ค๋ฉด, multi-dimensional model์ด ํ์๋ก ํ๋ basis function์ exponentialํ๊ฒ ์ฆ๊ฐํ๋ค. ์ด๊ฒ์ ๊ณ์ฐ๋ ๋ฟ๋ง ์๋๋ผ curse of dimensionality ๋ฑ์ ๋ฌธ์ ๋ฅผ ๋๋ฐํ๋ค.
์ด๋ฐ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ๋์์ผ๋ก 1991๋ , <MARS; Multi-variate Adaptive Regression Spline>๊ฐ ์ ์๋์๋ค.
๋, ์ ๊ท ๊ณผ์ ์ ๋ง์ง๋ง ์ฆ์์ ๋ค๋ฃฐ <Additive Model> ์ญ์ ์ด๋ฐ multi-dimensional model์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋์์ด ๋๋ค.
์ด์ด์ง๋ ํฌ์คํธ์์๋ KNN ๊ธฐ๋ฐ์ non-parametric method์ ๋ํด ์ดํด๋ณด๊ฒ ๋ค.
๐ KNN & kernel method