2021-1ํ•™๊ธฐ, ๋Œ€ํ•™์—์„œ โ€˜ํ†ต๊ณ„์  ๋ฐ์ดํ„ฐ๋งˆ์ด๋‹โ€™ ์ˆ˜์—…์„ ๋“ฃ๊ณ  ๊ณต๋ถ€ํ•œ ๋ฐ”๋ฅผ ์ •๋ฆฌํ•œ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ง€์ ์€ ์–ธ์ œ๋‚˜ ํ™˜์˜์ž…๋‹ˆ๋‹ค :)

1 minute read

2021-1ํ•™๊ธฐ, ๋Œ€ํ•™์—์„œ โ€˜ํ†ต๊ณ„์  ๋ฐ์ดํ„ฐ๋งˆ์ด๋‹โ€™ ์ˆ˜์—…์„ ๋“ฃ๊ณ  ๊ณต๋ถ€ํ•œ ๋ฐ”๋ฅผ ์ •๋ฆฌํ•œ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ง€์ ์€ ์–ธ์ œ๋‚˜ ํ™˜์˜์ž…๋‹ˆ๋‹ค :)

๐Ÿ’ฅ Boosting์˜ ํŒŒ์›Œ๋Š” ๊ฐ•๋ ฅํ•˜์ง€๋งŒ, ๋ฐฐ์šฐ๊ณ  ์ดํ•ดํ•˜๊ธฐ๋Š” ์–ด๋ ค์šด ํ…Œํฌ๋‹‰์ž…๋‹ˆ๋‹ค ใ… ใ…  ๋ฏธ๋ฆฌ ๋งˆ์Œ์˜ ์ค€๋น„๋ฅผ ํ•˜๊ณ  ์ž…์žฅํ•˜๊ธธ ๋ฐ”๋ž๋‹ˆ๋‹ค!


<Boosting>์€ Ensemble Method์˜ ์ผํ™˜์œผ๋กœ weak learniner๋“ค์„ ์—ฐ์†์ (sequential)์œผ๋กœ ์—ฌ๋Ÿฌ ๊ฐœ๋ฅผ ๊ฒฐํ•ฉํ•˜์—ฌ Prediction ์„ฑ๋Šฅ์„ ๋†’์ด๋Š” ๊ธฐ๋ฒ•์ด๋‹ค.

๋จผ์ € <Ensemble Method>๋ž€ ๋ชจ๋ธ์ด ํ•™์Šต ๋ฐ์ดํ„ฐ์— overfitting ๋˜์ง€ ์•Š๋„๋ก, overfit ๋˜์ง€ ์•Š์€ ์•ฝํ•œ ๋ชจ๋ธ ์—ฌ๋Ÿฌ๊ฐœ๋ฅผ ๊ฒฐํ•ฉํ•ด ์‚ฌ์šฉํ•œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.

<Boosting>์€ ์—ฌ๊ธฐ์— โ€œsequentialโ€์ด ์ถ”๊ฐ€๋œ๋‹ค. ์ง์ ‘ weak leaner์˜ Error๋ฅผ ๊ณ ๋ คํ•ด ์ƒˆ๋กœ์šด weak learner๋ฅผ ์žก์•„ ๋ชจ๋ธ์— ์ถ”๊ฐ€ํ•œ๋‹ค. ์ด ๊ณผ์ •์ด Sequential ํ•˜๊ฒŒ ์ง„ํ–‰ํ•˜๋Š” ๊ฒƒ์ด <Boosting>์˜ ํŠน์ง•์ด๋‹ค. ์ด ์ ‘๊ทผ์€ ์ถ”ํ›„์— ๋“ฑ์žฅํ•  Loss๋ฅผ ์ค„์ด๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ์ƒˆ๋กœ์šด weak learner๋ฅผ ์žก๋Š” <Gradient Boosting>์œผ๋กœ ํ™•์žฅ๋œ๋‹ค.

Ensemble Boosting.svg

By Sirakorn - Own work, CC BY-SA 4.0, Link

<Boosting>์˜ ํ•™์Šต์€ ๊ธฐ์กด ๋ชจ๋ธ์— weak learner๋ฅผ ์—ฐ์†์ ์œผ๋กœ ์ถ”๊ฐ€ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ์ด๋ค„์ง„๋‹ค. learner๊ฐ€ ์ถ”๊ฐ€๋  ๋•Œ, data weights๊ฐ€ ์กฐ์ •๋˜๋Š”๋ฐ, ์ด ๊ณผ์ •์„ โ€œre-weightingโ€œ์ด๋ผ๊ณ  ํ•œ๋‹ค. ์ž˜๋ชป ๋ถ„๋ฅ˜๋œ input data๊ฐ€ ๋” ํฐ weight๋ฅผ ๊ฐ–๋„๋ก ์กฐ์ •๋˜๋ฉฐ, ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ๋ถ„๋ฅ˜๋œ data๋Š” ๋‚ฎ์€ weight๋ฅผ ๊ฐ–๊ฒŒ ๋œ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋‹ค์Œ learner๋Š” ์ด์ „ learner์—์„œ ์•ฝ์ ์ด์—ˆ๋˜ ๋ถ€๋ถ„์— ์ข€๋” ์ง‘์ค‘ํ•  ์ˆ˜ ์žˆ๋‹ค.


<Boosting>์€ โ€œoff-the-shelf procedureโ€, ์ฆ‰ ๋ฐ”๋กœ ๊บผ๋‚ด ์จ๋„ ๋  ์ •๋„๋กœ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์ด๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋ผ๊ณ  ํ•œ๋‹ค.


์ฐธ๊ณ ์ž๋ฃŒ