Introduction to Boosting
2021-1ํ๊ธฐ, ๋ํ์์ โํต๊ณ์ ๋ฐ์ดํฐ๋ง์ด๋โ ์์ ์ ๋ฃ๊ณ ๊ณต๋ถํ ๋ฐ๋ฅผ ์ ๋ฆฌํ ๊ธ์ ๋๋ค. ์ง์ ์ ์ธ์ ๋ ํ์์ ๋๋ค :)
๐ฅ Boosting์ ํ์๋ ๊ฐ๋ ฅํ์ง๋ง, ๋ฐฐ์ฐ๊ณ ์ดํดํ๊ธฐ๋ ์ด๋ ค์ด ํ ํฌ๋์ ๋๋ค ใ ใ ๋ฏธ๋ฆฌ ๋ง์์ ์ค๋น๋ฅผ ํ๊ณ ์ ์ฅํ๊ธธ ๋ฐ๋๋๋ค!
<Boosting>์ Ensemble Method์ ์ผํ์ผ๋ก weak learniner๋ค์ ์ฐ์์ (sequential)์ผ๋ก ์ฌ๋ฌ ๊ฐ๋ฅผ ๊ฒฐํฉํ์ฌ Prediction ์ฑ๋ฅ์ ๋์ด๋ ๊ธฐ๋ฒ์ด๋ค.
๋จผ์ <Ensemble Method>๋ ๋ชจ๋ธ์ด ํ์ต ๋ฐ์ดํฐ์ overfitting ๋์ง ์๋๋ก, overfit ๋์ง ์์ ์ฝํ ๋ชจ๋ธ ์ฌ๋ฌ๊ฐ๋ฅผ ๊ฒฐํฉํด ์ฌ์ฉํ๋ค๋ ๊ฒ์ด๋ค.
<Boosting>์ ์ฌ๊ธฐ์ โsequentialโ์ด ์ถ๊ฐ๋๋ค. ์ง์ weak leaner์ Error๋ฅผ ๊ณ ๋ คํด ์๋ก์ด weak learner๋ฅผ ์ก์ ๋ชจ๋ธ์ ์ถ๊ฐํ๋ค. ์ด ๊ณผ์ ์ด Sequential ํ๊ฒ ์งํํ๋ ๊ฒ์ด <Boosting>์ ํน์ง์ด๋ค. ์ด ์ ๊ทผ์ ์ถํ์ ๋ฑ์ฅํ Loss๋ฅผ ์ค์ด๋ ๋ฐฉํฅ์ผ๋ก ์๋ก์ด weak learner๋ฅผ ์ก๋ <Gradient Boosting>์ผ๋ก ํ์ฅ๋๋ค.
By Sirakorn - Own work, CC BY-SA 4.0, Link
<Boosting>์ ํ์ต์ ๊ธฐ์กด ๋ชจ๋ธ์ weak learner๋ฅผ ์ฐ์์ ์ผ๋ก ์ถ๊ฐํ๋ ๋ฐฉ์์ผ๋ก ์ด๋ค์ง๋ค. learner๊ฐ ์ถ๊ฐ๋ ๋, data weights๊ฐ ์กฐ์ ๋๋๋ฐ, ์ด ๊ณผ์ ์ โre-weightingโ์ด๋ผ๊ณ ํ๋ค. ์๋ชป ๋ถ๋ฅ๋ input data๊ฐ ๋ ํฐ weight๋ฅผ ๊ฐ๋๋ก ์กฐ์ ๋๋ฉฐ, ์ฌ๋ฐ๋ฅด๊ฒ ๋ถ๋ฅ๋ data๋ ๋ฎ์ weight๋ฅผ ๊ฐ๊ฒ ๋๋ค. ์ด๋ฅผ ํตํด ๋ค์ learner๋ ์ด์ learner์์ ์ฝ์ ์ด์๋ ๋ถ๋ถ์ ์ข๋ ์ง์คํ ์ ์๋ค.
<Boosting>์ โoff-the-shelf procedureโ, ์ฆ ๋ฐ๋ก ๊บผ๋ด ์จ๋ ๋ ์ ๋๋ก ์ข์ ์ฑ๋ฅ์ ๋ณด์ด๋ ์๊ณ ๋ฆฌ์ฆ์ด๋ผ๊ณ ํ๋ค.
- AdaBoost; Adaptive Boosting
- Gradient Boosting; GBM
- XGBoost