Perceptron Algorithm, and Newtonโs Method
๋ณธ ๊ธ์ 2018-2ํ๊ธฐ Stanford Univ.์ Andrew Ng ๊ต์๋์ Machine Learning(CS229) ์์ ์ ๋ด์ฉ์ ์ ๋ฆฌํ ๊ฒ์ ๋๋ค. ์ง์ ์ ์ธ์ ๋ ํ์์ ๋๋ค :)
Perceptron Algorithm
์ด๋ฒ์๋ Learning Algorithm์ ์ญ์ฌ์ ๋ฐฐ๊ฒฝ ์ค ํ๋์ธ Perceptron Algorithm์ ๋ํด ์ดํด๋ณด์!
Perceptron Algorithm์ Logistic Regression์ sigmoid function $g(z)$๋ฅผ ์ฝ๊ฐ ๋ณํํ Threshold function์ ์ฌ์ฉํ๋ค.
hypothesis $h_{\theta}(x)$๋ฅผ $h_{\theta}(x)=g(\theta^{T}x)$๋ก ๋๊ณ Learning rule์ ๊ธฐ์ ํด๋ณด๋ฉด
์์ Logistic Regression์ด๋ Perceptron์ด๋ ๋์ผํ rule๋ก $\theta$๋ฅผ ์ ๋ฐ์ดํธํ๋ ๋ชจ์ต์ ๋ณผ ์ ์๋ค. ๊ทธ๋ฌ๋, ๋์ $h_{\theta}(x)$๊ฐ ๋ค๋ฅด๊ธฐ ๋๋ฌธ์ ์์ฐํ ๋ค๋ฅธ ์๊ณ ๋ฆฌ์ฆ์ด๋ค!
Perceptron์ 1960๋ ๋์ ์ธ๊ฐ์ Neuron์ ๋ณธ๋ฌ ๋ชจ๋ธ์ด๋ค. ํ์ง๋ง, Logistic Regression๊ณผ Linear Regression๊ณผ๋ ๋ฌ๋ฆฌ ๋ง๋ ํ ํต๊ณํ์ ์๋ฏธ๋ Maximum Likelihood Estimation๊ณผ ์ ์ ์ด ์๋ค.
Newtonโs Method
$\theta$๋ฅผ ์ต์ ํํ๋ ๋๋ค๋ฅธ Iterative Learning์ ์ดํด๋ณด์!
Newtonโs Method๋ real-valued function $f$์ ๋ํด $f(\theta)=0$์ด ๋๋ $\theta$๋ฅผ ์ฐพ๋ ๋ฐฉ์์ด๋ค.
์ฐ๋ฆฌ๋ log likelihood $l(\theta)$๋ฅผ Maximizeํ๋ $\theta$๋ฅผ ์ฐพ๋ ๊ฒ์ด ๋ชฉํ์ด๋ค. ์ฆ, $lโ(\theta)$๋ฅผ ์ฐพ์์ผ ํ๋ฉฐ, ์ด๊ฒ์ Newtonโs Method๋ฅผ ํตํด ์ฐพ์ ์ ์๋ค!!
๊ทธ๋ฆฌ๊ณ ๊ทธ ๊ท์น์ ๋ค์๊ณผ ๊ฐ๋ค.
Newtonโs Method๋ ์ค์ง linear function๋ง์ ์ฌ์ฉํด ํจ์ซ๊ฐ์ด 0์ด ๋๋ ์ง์ ์ ์ฐพ๋ ๊ฐ์ฅ ์์ด์ ์ธ ๋ฐฉ์์ด๋ค.
Newtonโs Method๋ ์์ Gradient Descent ๋ฐฉ์๊ณผ ๋น๊ตํ์ ๋, ๋งค์ฐ ์ ์ step์ผ๋ก ์ต์ ์ $\theta$๋ฅผ ์ป๋๋ค.
์ฐ๋ฆฌ๊ฐ ์ํ๋ $\theta$๋ 1D real-value๊ฐ ์๋๋ผ N-dimensional real-valued vector์ด๋ค. ๊ทธ๋์ Newtonโs Method๋ฅผ ์ผ๋ฐํํด๋ณด์!
์ด๊ฒ์ ์ผ๋ฐํํ๋ฉด
์ด๋ค.
๊ทธ๋ฆฌ๊ณ ์ด๊ฒ์ vector form์ผ๋ก ์ผ๋ฐํํ๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
์ด๋, $H$๋ Hessian์ด๋ค. vector function์ Derivate๋ฅผ ์๋ฏธํ๋ค.
๋ถ๋ช Newtonโs Method๋ ์ ์ step์ผ๋ก ์ต์ ์ $\theta$๋ฅผ ์ฐพ์๋ธ๋ค. ํ์ง๋ง, Newtonโs Method์ ๊ณต์์ ์ดํด๋ณด๋ฉด n-by-n ํ๋ ฌ์ ์ญํ๋ ฌ์ธ $H^{-1}$๋ฅผ ๊ตฌํ๋ ๊ณผ์ ์ด ์๋ค! n์ด ์๋ค๋ฉด ์ญํ๋ ฌ์ ๊ตฌํ๋ ๋น์ฉ์ด ํฌ์ง ์๊ฒ ์ง๋ง, n์ด ์ปค์ง๋ค๋ฉด ์ญํ๋ ฌ์ ๊ตฌํ๋ ๋น์ฉ์ ์์ฃผ์์ฃผ ์ปค์ง๋คโฆ ๊ทธ๋์ Netwonโs Method๋ $\theta$๊ฐ ๊ฐ๋ feacture๊ฐ ์ ์ ๋๋ง ์ฌ์ฉํ ์ ์๋ค๋ ์ ์ฝ์ ๊ฐ์ง๋ค.
๋งบ์๋ง
- Perceptron Algorithm์ ๊ฐ์ฅ ์ด๊ธฐ์ ๋จธ์ ๋ฌ๋ ๊ธฐ๋ฒ์ด๋ค.
- ํ์ง๋ง, ํต๊ณํ์ ์๋ฏธ๋ MLE์์ ์ ์ ์ด ์๋ค.
- Newtonโs Method๋ ํจ์ซ๊ฐ์ 0์ผ๋ก ๊ทผ์ฌํ๋ ๊ฐ์ฅ ์์ด์ ์ธ ์ ๊ทผ๋ฒ์ด๋ค.
- Newtonโs Method๋ ๋ ์ ์ step์ผ๋ก ์ต์ ํด์ ๋๋ฌํ๋ค.
- ํ์ง๋ง, n-by-n ํ๋ ฌ์ธ Hessian $H$์ ์ญํ๋ ฌ์ ๊ตฌํ๋ ๋น์ฉ์ด ํฌ๋ค๋ฉด ์ฌ์ฉํ ์ ์๋ค.