SARIMA Model

2 minute read

SARIMA Model

SARIMA ๋ชจ๋ธ์€ ARIMA ๋ชจ๋ธ์— ๊ณ„์ ˆ์  ์š”์†Œ๋ฅผ ๊ฒฐํ•ฉํ•œ ๋ชจ๋ธ์ด๋‹ค. ์ˆ˜์‹์€ ํฌ๊ฒŒ ๋น„๊ณ„์ ˆ ์š”์ธ๊ณผ ๊ณ„์ ˆ ์š”์ธ์— ๋Œ€ํ•œ ๋ถ€๋ถ„์œผ๋กœ ๋‚˜๋‰œ๋‹ค.

\[\text{SARIMA}(p, d, q)(P, D, Q)_m\]

์—ฌ๊ธฐ์—์„œ $(p, d, q)$๋Š” ๋น„๊ณ„์ ˆ ์š”์ธ์— ๋Œ€ํ•œ, $(P, D, Q)_m$์€ ๊ณ„์ ˆ ์š”์ธ์— ๋Œ€ํ•œ Hyper-parameter์ด๋‹ค.

$(P, D, Q)_m$์—์„œ $(P, D, Q)$๋Š” ๊ธฐ์กด ARIMA์˜ Hyper-parameter์™€ ๋ชจ๋‘ ๋™์ผํ•œ ์˜๋ฏธ์ด๋‹ค. $m$์€ ๊ณ„์ ˆ ์š”์†Œ์˜ ์ฃผ๊ธฐ๋กœ ์›”๋ณ„ ์‹œ๊ณ„์—ด์—์„œ $m=12$๋ผ๋ฉด, 1๋…„ ์ฃผ๊ธฐ์˜ ๊ณ„์ ˆ ์š”์ธ์„ ๋ชจ๋ธ๋งํ•˜๊ฒŒ ๋œ๋‹ค.

Backshift ์—ฐ์‚ฐ์ž๋กœ ํ‘œํ˜„ํ•œ $\text{SARIMA}(1, 1, 1)(1, 1, 1)_4$์˜ ์ˆ˜์‹์€ ์•„๋ž˜์™€ ๊ฐ™๋‹ค.

\[(1 - \phi_1 B) (1 - \Phi_1 B^4) (1 - B) (1 - B^4) Z(t) = (1 + \theta_1 B)(1 + \Theta_1 B^4) \epsilon(t)\]

Example: Datadog Anomaly Detection

์ธํ”„๋ผ ๋ฆฌ์†Œ์Šค ๋ชจ๋‹ˆํ„ฐ๋ง ์„œ๋น„์Šค์ธ Datadog์€ SARIMA ๋ชจ๋ธ์„ ํ†ตํ•ด Anomaly Detection์„ ์ˆ˜ํ–‰ํ•œ๋‹ค๊ณ  ํ•œ๋‹ค.

์ž์„ธํ•œ ๋‚ด์šฉ์ด ๊ถ๊ธˆํ•˜๋‹ค๋ฉด, ์œ„์˜ ์บก์ณ๋ฅผ ํด๋ฆญํ•ด๋ณด์ž. ๐Ÿ‘

SARIMAX Model

SARIMAX๋Š” SARIMA ๋ชจ๋ธ์— โ€œ์™ธ์ƒ๋ณ€์ˆ˜(eXogenous variable)โ€์„ ์ถ”๊ฐ€๋กœ ๊ณ ๋ คํ•˜๋Š” ๋ชจ๋ธ์ด๋‹ค. ์™ธ์ƒ๋ณ€์ˆ˜๋ž€ ์‹คํ—˜ ๋Œ€์ƒ์ด ๋˜๋Š” ๋ณ€์ˆ˜ ์ด์™ธ์˜ ๊ธฐํƒ€ ๋ถ€์ˆ˜์ ์ธ ๋ณ€์ˆ˜๋ฅผ ๋งํ•œ๋‹ค.

์ด์ œ๊นŒ๊ธฐ ์‚ดํŽด๋ดค๋˜ ์‹œ๊ณ„์—ด ๋ชจ๋ธ์ด $\{ Z(t) \}$ ํ•˜๋‚˜๋ฅผ ๊ฐ€์ง€๊ณ  ๋ชจ๋ธ๋ง ํ–ˆ๋‹ค๋ฉด, SARIMAX ๋ชจ๋ธ์€ ์™ธ์ƒ๋ณ€์ˆ˜ $\{ E(t) \}$๋ฅผ ํ•จ๊ป˜ ๊ณ ๋ คํ•ด ์‹œ๊ณ„์—ด $\{ Z(t) \}$๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๋ชจ๋ธ์ด๋‹ค.


๋งบ์Œ๋ง

๊ณ ์ „์ ์ธ ์‹œ๊ณ„์—ด ๋ถ„์„๊ณผ ๋ชจ๋ธ๋ง์€ ์—ฌ๊ธฐ SARIMAX ๋ชจ๋ธ๊นŒ์ง€ ์•Œ๋ฉด ์ ๋‹นํ•œ ๊ฒƒ ๊ฐ™๋‹ค. ํ•ต์‹ฌ์ด ๋˜๋Š” ์ฝ˜์…‰ํŠธ๋Š” ๋ชจ๋‘ ์ปค๋ฒ„ํ–ˆ๊ธฐ ๋•Œ๋ฌธ์— ์ด ์ •๋„๋ฉด ์ถฉ๋ถ„ํ•˜๋‹ค๊ณ  ์ƒ๊ฐํ•œ๋‹ค.

์•„์ง ์‹œ๊ณ„์—ด ๋ถ„์„์— ๋Œ€ํ•œ ๋งŽ์€ ์ ‘๊ทผ๊ณผ ์—ฐ๊ตฌ, ๋…ผ๋ฌธ์ด ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์ตœ์‹  ์—ฐ๊ตฌ๋ฅผ ์ปค๋ฒ„ํ•˜๋ ค๋ฉด ์ด ์ •๋„์—์„œ ๋‹ค์Œ ์ฃผ์ œ๋กœ ๋„˜์–ด๊ฐ€์ž ๐Ÿ˜‰

Reference