Statistical Data Mining
2021-1ํ๊ธฐ์ ์๊ฐํ POSTECH ์ฑ๋ฏผ์ฐ ๊ต์๋์ โํต๊ณ์ ๋ฐ์ดํฐ ๋ง์ด๋(IMEN472)โ ์์ ์์ ๋ฐฐ์ด ๊ฒ๊ณผ ๊ณต๋ถํ ๊ฒ์ ์ ๋ฆฌํ ์งํฌ ๋ธ๋ก๊ทธ์ ๋๋ค. ๊ฐ์ธ์ ์ผ๋ก ๋ณธ์ธ์ด ์ฒ์ ๋์ ํด๋ณด๋ ๋ถ์ผ๊ณ ์์ฉ ์ํ์ ์๋ง์ ํ ํฌ๋๋ค์ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ ์์ ์ ๋ฐ๋ผ๊ฐ๋๊ฒ ์ฝ์ง๋ ์์์ต๋๋ค๋ง, ๋ณธ ์์ ์ ํตํด์ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค์ ๋ํ ํ๋ก ํฐ์ด๋ฅผ ๋ง๋ณผ ์ ์์์ต๋๋ค. ๐คฏ
์ฐธ๊ณ ๊ต์ฌ
- ใThe Elements of Statistical Learningใ Trevor Hastie ยท Robert Tibshirani ยท Jerome Friedman, 2nd ed.
- ใAn Introduction to Statistical Learningใ Gareth James ยท Daniela Witten ยท Trevor Hastie ยท Robert Tibshirani, 1st ed.
- CS229: Machine Learning, Andrew Ng, Stanford Univ. 1
Supplementary
์์ผ๋ก ์ด์ด์ง๋ โํต๋ฐ๋งโ์ ์ค์ ์ ๋ง์ฃผํ๊ธฐ ์ ์ โ๋ฐ๋์โ ์์์ผ ํ๋ ๋ด์ฉ๋ค์ ๋๋ค. ์ฌ๊ธฐ์ ๋ฑ์ฅํ๋ ๋ชจ๋ ๋ด์ฉ๊ณผ ์ํ์ ํํ์ ์ถฉ๋ถํ ์ต์ํด์ ธ์ผ ํฉ๋๋ค.
ํผ์ณ๋ณด๊ธฐ
Linear Algebra
- Basic Linear Algebra
- Column space & Row space & Null space
- Fundamental Theorem of Linear Algebra
- Eigen value & Eigen vector
- Vector Calculus & Matrix Calculus
- Spectral Decomposition & Singular Value Decomposition
- Nonnegative Definite & Positive Definite Matrix
- Orthogonal Projection
Multivariate Normal Distribution
Conditional Expectation
Introduction
- Introduction to Regression & Classification
- Least Squared Method
- Nearest Neighbor Method
- Curse of dimensionality
Linear Methods for Regression
- Feature Selection
- Best Subset Selection
- Forward Stepwise Selection
- Backward Stepwise Selection
- Mallowโs $C_p$
- AIC & BIC
- Instability of Variable Selection
-
Shrinkage Method
- Lasso Regression
- Ridge Regression
Non-parametric Method
- Non-parametric Linear Regression
- Polynomial Regression
- Local Polynomical Regression
- Regression Spline ๐ฅ
- Natural Cubic Spline
- power basis function
- Smoothing Splines
- knot selection
- Non-parametric Logistic Regression
- Multi-dimensional Splines
- Polynomial Regression
- KNN Method
- Additive Model
- Backfitting Algorithm
- GAM; Generalized Additive Models ๐ฅ
- MARS; Multivariate Adaptive Regression Spline ๐ฅ
Boosting
- Introduction to Boosting
- AdaBoost
- Gradient Boosting
- XGBoost
Random Forest
Appendix
-
์์ ์ ์ผ๋ถ ํ ํฝ์์ CS229์์ ๋ฐฐ์ด ๋ถ๋ถ์ด ์ข ์ข ๋ฑ์ฅํ์ต๋๋ค. CS229์์ ํต๊ณ์ ์ ๊ทผ์ ํตํด ๊ณ ์ ์ ์ธ ๋จธ์ ๋ฌ๋์ ๋ค๋ฃจ๊ธฐ ๋๋ฌธ์ ๋ ๊ณผ๋ชฉ์ ๊ณต๋ถํ๋ ๋ฐ์ ์๋ฐฉํฅ์ผ๋ก ๋์์ ๋ง์ด ๋ฐ์์ต๋๋ค ๐ย ↩