Multi-class Classification
๋ณธ ๊ธ์ 2018-2ํ๊ธฐ Stanford Univ.์ Andrew Ng ๊ต์๋์ Machine Learning(CS229) ์์ ์ ๋ด์ฉ์ ์ ๋ฆฌํ ๊ฒ์ ๋๋ค. ์ง์ ์ ์ธ์ ๋ ํ์์ ๋๋ค :)
โ lecture 4
Multi-class ClassificationPermalink
์ง๊ธ๊น์ง์ Classification Problem์
(์ฌ์ ์ง์) Multinomial DistributionPermalink
์ด๋ฒ ๊ธ์ ์ดํดํ๊ธฐ ์ํด์ Multinomial Distribution๋ฅผ ๋จผ์ ์ดํดํ ํ์๊ฐ ์๋ค.
์ฐ๋ฆฌ๋ ์ด๋ฏธ โ-nomialโ์ด ๋ถ์ ๋จ์ด๋ฅผ ํ๋ ์๊ณ ์๋ค. ๋ฐ๋ก Bi-nomial์ด๋ค. Binomial Distribution์ ์ดํญ๋ถํฌ๋ก,
์ดํญ๋ถํฌ์์
๊ทธ๋ฆฌ๊ณ ์ดํญ๊ณ์
์ดํญ๋ถํฌ์ ์ํฉ์ Multi-class๋ก ํ์ฅํ๋ฉด, ๋คํญ๋ถํฌ, Multinomial์ด ๋๋ค.
Multinomial Distribution์์๋ ํ๋ณธ๊ฐ์ด ๋ฒกํฐ
๋คํญ๋ถํฌ์์์ ๊ณ์๋ ์ดํญ๋ถํฌ์ ์ดํญ๊ณ์
Multi-Class Classification with GLMPermalink
Multi-Class Classification Problem์ GLM์ ๊ผด๋ก ๊ธฐ์ ํด๋ณด์.
๋จผ์
๊ทธ๋ฆฌ๊ณ
์ด๋ ํธ์๋ฅผ ์ํด ๋ง์ง๋ง ํด๋์ค์ธ
์ด๊ฒ์ ํตํด ๋ฒกํฐ
์ด๋ฒ์ ๊ฐ class ๋ณ๋ก parameter
๊ทธ๋์ ์ ์ฒด class์ parameter๋ฅผ ๋ชจ์
์ฐ๋ฆฌ๋ ๋ ํ๋์ ์๋ก์ด ํ๊ธฐ๋ฒ์ ๋์
ํ๋ค. indicator function
์ด๊ฒ์ ํ์ฉํด ํ๋ฅ
์ด์
์ด์ GLM์ ๊ฐ ์์๋ค์ ํ์ธํด๋ณด๋ฉด,
: : :
๊ฐ ๋๋ค.
์ด๋ฒ์ link function์ ์ญํจ์๋ฅผ ์ทจํด response function์ ์ดํด๋ณด์.
๋ฐ๋ผ์
๊ฐ ๋๋ค.
์ด์ ์ด softmax function์ ์ด์ฉํด ํ๋ฅ
์ด ๊ณผ์ ์์ GLM์ ๊ฐ์ ์ธ โnatural parameter
์ด๋ ๊ฒ softmax function์ response function์ผ๋ก ์ฌ์ฉํ๋ regression์ softmax regression์ด๋ผ๊ณ ํ๋ค. softmax regression์ logistic regression์ general model์ด๋ค.
์ด์ ์ฐ๋ฆฌ์ ์ต์ข
์ ์ธ ์ถ๋ ฅ๊ฐ์ธ hypothesis
์์ ์์์๋
Cross EntropyPermalink
์์์ ๋ค๋ฃฌ Softmax Regression์ ๊ทธ๋ฆผ์ ํตํด ๋ณต์ตํ๋ฉด์ Softmax Regression์ Loss function์ธ Cross Entropy์ ๋ํด ์ดํด๋ณด์.
์ฐ๋ฆฌ๋

ํ์ง๋ง

์ด์
์ด๋
๊ทธ๋ฆฌ๊ณ ์ฐ๋ฆฌ๊ฐ ์์ ๊ณผ์ ์์ ๊ตฌํ
์ด์ parameter
๋งบ์๋งPermalink
๋ณธ ๊ธ์์๋ Multi-class Classification์ GLM์ ๊ด์ ์์ ์ดํด๋ณด์๋ค. ๋ด์ฉ์ ์์ฝํ๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
- Multi-class Classification์ Multinomial์์ ์ถ๋ฐํ๋ค.
- softmax function ํจ์๋
๋ฅผ ๋ก ๋งคํํ๋ response function์ด๋ค. - Cross Entropy๋ ์ ๋ต ๋ ์ด๋ธ
๊ณผ softmax function์ผ๋ก ์ป์ predicted probability ์ฌ์ด์ ์ค์ฐจ๋ฅผ ์ ์ํ๋ ํจ์์ด๋ค.