Gaussian Process Regression
โMachine Learningโ์ ๊ณต๋ถํ๋ฉด์ ๊ฐ์ธ์ ์ธ ์ฉ๋๋ก ์ ๋ฆฌํ ํฌ์คํธ์ ๋๋ค. ์ง์ ์ ์ธ์ ๋ ํ์์ ๋๋ค :)
๋ณธ ๊ธ์ ์ฝ๊ธฐ ์ ์ โDistribution over functions & Gaussian Processโ์ ๋ํ ๊ธ์ ๋จผ์ ์ฝ๊ณ ์ฌ ๊ฒ์ ๊ถํฉ๋๋ค ๐
๊ธฐํ ์๋ฆฌ์ฆ: Gaussian Process Regression
โDistribution over functions & Gaussian Processโ๋ฅผ ํตํด Gaussian Process๋ก ํจ์์ ๋ํ ํ๋ฅ ๋ถํฌ(distribution over functions)๋ฅผ ์ด๋ป๊ฒ ๋ชจ๋ธ๋งํ๋์ง ์ดํด๋ณด์๋ค. ์ด๋ฒ ํฌ์คํธ์์๋ distribution over functions๊ฐ Bayesian Regression์ ํจ๋ฌ๋ค์ ์๋์์ ์ด๋ป๊ฒ ํ์ฉ๋๋์ง๋ฅผ ์ดํด๋ณธ๋ค๐
Gaussian Process RegressionPermalink

๋จผ์ <Gaussian Process Regression; ์ดํ GP Regression>์ ์ํํ๊ธฐ ์ํ ์ ์ ์ ํด๋ณด์.
i.i.d. sample์ ๋ชจ์์ธ train set
์ด๋
<Bayesian Regression>์์
์ด์
โป NOTE:
์ด๋ฒ์๋
PredictionPermalink
์ฐ๋ฆฌ๋ prior distribution over function
matrix-form์ ํ๊ธฐ๊ฐ ๋ง์ด ๋ฑ์ฅํ์ง๋ง ๋ฐ๋ก ํ๊ธฐ๋ฅผ ์ค๋ช ํ์ง๋ ์๊ฒ ๋ค ๐
๋ i.i.d. noise์ ๋ํด์ ์๋๊ฐ ์ฑ๋ฆฝํ๋ค.
์ด์ ์ด๊ฑธ ์ข ํฉํ๋ฉด,
๊ฐ ๋๋๋ฐ, independent Gaussian random variable์ ํฉ์ ์ญ์ Gaussian์ด๋ฏ๋ก
์์ ์์
where (
์ ๋ ๊ณผ์ ์ conditional distribution of multi-variate Gaussiaion distribution์ ๋ํ ์์ ๊ทธ๋๋ก ์ฌ์ฉํ๋ฉด ๋๋ค. ๐
Boom! ์ด๊ฒ์ผ๋ก ์ฐ๋ฆฌ๋ posterior predictive distribution์ ์ป์๋ค!! ๐คฉ ์ด์ ์ Bayesian Linear Regression์ ๊ฒ๊ณผ ๋น๊ตํด๋ณด๋ฉด GP Regression์ ์ ๋ง ๊ณ์ฐ์ ์ผ๋ก๋ ์ ๋ง ๊ฐ๋จํ ํํ์์ ํ์ธํ ์ ์๋ค ๐
๋ณด์ถฉ
์์์
then, the conditional distribution is
๊ฐ ๋๋ค. ์ด๊ฒ์ด posterior distribution over function
InsightsPermalink
์ด๋ฒ ๋ฌธ๋จ์์๋ GP Regression์ ๋ํ ํต์ฐฐ๋ค์ ๋ํด ์ดํด๋ณผ ๊ฒ์ด๋ค. locally-weighted linear regression์ฒ๋ผ GP Regression์ non-parameteric regression model์ด๋ค. ์ด๋ input data์ ํจ์์ ์ ํ์ ๋ํ ๊ฐ์ ์ด๋ ๋คํญ์์ ๋ํ ๊ฐ์ ์ ํ ํ์๊ฐ ์์ผ๋ฉฐ arbitrary function์ ๋ค๋ฃจ๋ ๊ฒ์ด ๊ฐ๋ฅํ๋ค๋ ๊ฒ์ ๋งํ๋ค! ๐คฉ ๋ํ์์ ๋ค์๋ โํต๊ณ์ ๋ฐ์ดํฐ๋ง์ด๋(IMEN472)โ ์์ ์์ non-parameteric model์ ๋ํด ๋ค๋ฃจ๊ธด ํ๋๋ฐ, <GP Regression>์ ๋ค๋ฃจ์ง ์์๋ค.
GP์์ ์ฌ์ฉํ๋ <squared exponential kernel>
hyper-parameter์ธ
๋ค์์ผ๋ก regression noise์ธ
๋งบ์๋งPermalink
์ง๊ธ๊น์ง <GP Regression>์ ๋ํด ์ดํด๋ณด์๋ค. ์ด ๋ ์์ bayesian regression model์ด๋ฉด์ non-parameteric model์ธ ๋ ์์ด์๋ค. ๊ฒ๋ค๊ฐ <GP Regression>์ anomaly detection์ ์ฌ์ฉํ๋ค๋ฉด, anomaly set์ ๋ํ labeling ์์ด unsupervised learning๋ก anomaly detection์ ํ์ฉํ ์ ์๋ค ๐ ๊ฐ์ธ์ ์ผ๋ก GP Regression์ ์ค์ ์์๋ ๊ต์ฅํ ์ฑ๋ฅ๊ณผ ๊ทธ๋ด๋ฏํ ๊ฒฐ๊ณผ๋ฅผ ๋์ถํ์ด์ ๊ฝค ๋ง์กฑํ๋ค ๐ ์ํคํผ๋์์์๋ GP Regression์ โkrigingโ์ด๋ผ๊ณ ๋ถ๋ฅด๋๋ฐ, ๋ฌธ์๋ฅผ ์ฝ์ด๋ณด๋ GP Regression์ ๋ํ ๋ ๊น๊ณ ๋ง์ ๋ด์ฉ์ ๋ค๋ฃจ๊ณ ์๋ค. GP Regression์ด ๋ ๊ถ๊ธํ๋ค๋ฉด ํด๋น ๋ฌธ์๋ฅผ ์ฝ์ด๋ณด์! ๐
๋ค์ ์๋ฆฌ์ฆ๋ก๋ MCMC(Markov Chain Monte Carlo)๋ฅผ ์๊ฐํ๊ณ ์๋ค. ๋ํ์์ โ์ธ๊ณต์ง๋ฅโ ๊ณผ๋ชฉ ๋ค์ ๋ ๋ณด๊ธด ํ๋๋ฐ ๊ทธ๋๋ ์ ๋๋ก ์ดํด๋ฅผ ๋ชป ํ์๋ค ๐ฅ
referencesPermalink
- Gaussian processes - Chuong B. Do
- โ์์ฐโ๋์ ํฌ์คํธ
- An Intuitive Tutorial to Gaussian Processes Regression
-
Bayesian Linear Regression์์๋ prior distribution์ ์ฌ์ฉํ๋๋ฐ, ๊ทธ๋๋ parameter
์ ๋ํ <parameter prior> ์๋ค! ๊ทธ๋ฌ๋ Bayesian Regression๊ณผ ๋ฌ๋ฆฌ GP Regression์ parameter ๋ฅผ ์ฌ์ฉํ์ง ์๋ non-parameteric ๋ชจ๋ธ์ด๋ค!! ์ด์ ๋ํด์ ๋ท ๋ฌธ๋จ์์ ๋์ ๋น๊ตํ๋ฉฐ ํ๋ฒ ๋ ์ดํด๋ณด๊ฒ ๋ค ๐ โฉ