Auto-Correlation: ACF & PACF
μ ν κ°λ
νΌμ³λ³΄κΈ°
Definition. Variance
Definition. Covariance
Definition. Correlation
- Correlationμ $\left[ -1, 1 \right]$μ λ²μλ₯Ό κ°λλ€.
- μμ κ°μ Correlationμ Pearson Correlation $r_{XY}$λΌκ³ νλ€.
Definition. Partial Correlation
where $e_{X}$ and $e_{Y}$ are residual of multiple regression fitting on $\mathbf{z}$.
Auto-Correlationμ΄λ?
μκ³μ΄ λ°μ΄ν° $\{ s(t) \}$μμ $s(t)$λ μ΄μ μ νμ μ€ν μ $s(t-1)$, $s(t-2)$ κ°μμ κ°μκΈ° ν¬κ² μμΉνλ€κ±°λ, κ°μκΈ° ν¬κ² νλ½νλ μΌμ ννμ§ μλ€.
Correlation $\text{Corr}(X, Y)$μ λ³Έλ μλ‘ λ€λ₯Έ λ Random Variable $X$, $Y$μ μκ΄μ±μ 보기 μν μ§νμ΄λ€. κ·Έλ°λ°, μκ³μ΄ λ°μ΄ν°μμ μμ κ³Ό μ΄μ μ κ° μ¬μ΄μ μκ΄μ±μ 보기 μν΄ Auto-Correlation $\text{Corr}(s(t), s(t-1))$λ₯Ό ꡬνλ€.
\[\text{Corr}(s(t), s(t-1)) = \frac{\text{Cov}(s(t), s(t-1))}{\sqrt{\text{Var}(s(t))} \sqrt{\text{Var}(s(t-1))}} = \frac{\text{Cov}(s(t), s(t-1))}{\text{Var}(s(t))}\]Auto-Correlationμ μμκ³Ό 컨μ μ λ³λ‘ μ΄λ ΅μ§ μλ€. μκ³μ΄ λ°μ΄ν°λ₯Ό $t$μ $t-1$λ‘ νννλ©΄ μλμ κ°μλ°,
$t$ | $s(t)$ | $s(t-1)$ |
---|---|---|
1 | 11 | 10 |
2 | 12 | 11 |
3 | 14 | 12 |
4 | 16 | 14 |
5 | 20 | 16 |
μκ³μ΄ $s(t)$κ° μμ κ°μ ν¨ν΄μ 보μΈλ€λ©΄, Auto-Corrrelation $\text{Corr}(s(t), s(t-1))$λ μ(+)μ λΆνΈλ₯Ό κ°μ§ κ²μ΄λ€.
Auto-Correlation μμμ μ’λ μΌλ°νν΄μ Auto-Correlation Function, ACFλ‘ νννκΈ°λ νλ€. μ΄μ $k$ μ€ν κ³Όμ μκ΄μ±μ 보기 μν ACF $\text{ACF}(k)$λ μλμ κ°μ΄ μ μνλ€.
\[\text{ACF}(k) = \frac{\text{Cov}(s(t), s(t-k))}{\text{Var}(s(t))}\]Example: goog200

goog200
μ΄λΌλ μκ³μ΄ μ£Όκ° λ°μ΄ν°μμ ACFλ₯Ό ꡬν΄λ³΄λ©΄ μλμ κ°λ€.

μ λ°μ μΌλ‘ μ΄μ μ λ°μ΄ν°μ λμ μ(+)μ μκ΄μ±μ 보μ΄λ κ²μ μ μ μλ€.
Partial ACF
$\text{ACF}(k)$λ $s(t)$μ $s(t-k)$, λ κ°μ μκ΄μ±μ μΆλ ₯νλ€. κ·Έλ¬λ κ·Έ μ¬μ΄μ μλ $s(t-1)$λΆν° $s(t-(k-1))$μ μν₯λ ₯μ΄ μ‘΄μ¬νμ§ μμμκΉ? π€

$s(t)$μ $s(t-1)$κ° μκ΄μ±μ΄ μλ€λ©΄, $s(t-1)$μ $s(t-2)$λ μκ΄μ±μ΄ μμ κ²μ΄λ€. κ·Έλ λ€λ©΄, $s(t)$μ $s(t-2)$λ μκ΄μ±μ΄ μμ κ²μ΄λΌλκ² μμ°μ€λ½κ² μ λλλ€.
<Partial Correlation>λΌλ κ°λ μ΄ μλ€. μμΈν λ΄μ©μ βPartial Correlationβ ν¬μ€νΈμ μ μ΄λμ§λ§, κ°λ¨ν λ§ν΄λ³΄μλ©΄. μ¬λ¬ κ°μ λ 립λ³μκ° μκ³ , κ° λ 립λ³μ μ¬μ΄μ μ΄λμ λμ Correlationμ΄ μμ λ, κ·Έλ° λ 립λ³μ μ¬μ΄μ μκ΄μ±μ λ°°μ νκ³ μ€μ§ λ 립λ³μ λ¨λ μ μ’ μλ³μμ λν Correlationμ μΈ‘μ νλ λ°©λ²μ΄λ€.
Partial ACF $\text{PACF}(k)$ μμ $s(t)$μ $s(t-k)$μ μκ΄μ±μ μΈ‘μ νλ€λ κ²μ $\text{ACF}(k)$μ λμΌνλ€. κ·Έλ¬λ $\text{PACF}(k)$λ $s(t)$μ $s(t-k)$ μ¬μ΄μ $s(t-1)$λΆν° $s(t-(k-1))$μ μν₯μ λ°°μ νκ³ μκ΄μ±μ μΈ‘μ νλ€!
Example
λ€μ goog200
μκ³μ΄ μ£Όκ° λ°μ΄ν°λ₯Ό νμ©ν΄ PACF κ·Έλνλ₯Ό κ·Έλ €λ³΄μ.

μ΄λ²μλ ACFμ λ€λ₯΄κ², $\text{PACF}(1)$μμλ§ ν° μκ΄μ±μ 보μλ€. μ΄κ²μ ν΅ν΄ $S(t)$μ $S(t-1)$κ° μ’λ μ μν μκ΄κ΄κ³κ° μμ κ±°λΌκ³ μκ°ν μ μλ€! π
Derivation
PACFλ₯Ό μ λνλ κ²μ Partial Correlation $\rho_{XY\cdot Z}$λ₯Ό μ λνλ κ²κ³Ό λμΌνλ€. μν₯μ λ°°μ νκ³ μ νλ λ 립λ³μμ λν΄ Linear Regression Fittingμ νκ³ , μμ°¨(residual)μ λν΄ Correlationμ ꡬν΄μ£Όλ©΄ λλ€! π
Simple Case
μ°μ κ°λ¨ν $k=2$μΈ κ²½μ°λΆν° μ λν΄λ³΄μ. μ°λ¦¬λ $\text{PACF}(2)$, μ¦ $s(t)$μ $s(t-2)$μ Partial Auto-Correlationμ ꡬνκ³ μ νλ€.
λ¨Όμ μλμ κ°μ΄ Linear Regression Fittingμ νλ€.
\[\begin{aligned} w^{\ast}_{s(t)} &= \underset{w}{\text{argmin}} \left\{ \sum_{i} = (s(i) - w \cdot s(i-1))^2 \right\} \\ w^{\ast}_{s(t-2)} &= \underset{w}{\text{argmin}} \left\{ \sum_{i} = (s(i-2) - w \cdot s(i-1))^2 \right\} \end{aligned}\]κ°μΈμ μΌλ‘ PACFμ μμ μ΄ν΄νλ €κ³ ν λ, μ΄ν΄κ° μ λλ λΆλΆμ΄ $s(t)$μμλ $s(t-1)$μ λν΄ Fitting νλλ°, $s(t-2)$μμ κ·Έ μ΄μ μ€ν μΈ $s(t-1)$λ‘ Fitting νλ κ²μ΄μλ€. $s(t-2)$μ $s(t-3)$λ‘ Fitting νλκ² μλλΌ λ§μ΄λ€!
μ¬μ€ μ΄κ±΄ <Partial Correlation>μ μ μλ₯Ό μ΄ν΄νλ©΄μ ν΄μλμλ€. $s(t)$μ $s(t-2)$μ Partial Correlationμ ꡬνκΈ° μν΄ κ·Έ μ¬μ΄μ λ€λ₯Έ λ 립λ³μμΈ $s(t-1)$μ μν₯μ λ°°μ νλ κ³Όμ μ΄λ―λ‘, λ λ³μμμ $s(t-1)$μ λν΄ Fitting νλ κ²μ΄ λ§λ€! π
μ΄μ μμ°¨(residual)μ ꡬνλ©΄,
\[\begin{aligned} e_{s(t), i} &= s(i) - w^{\ast}_{s(t)} \cdot s(i-1) \\ e_{s(t-2), i} &= s(i-2) - w^{\ast}_{s(t-2)} \cdot s(i-1) \end{aligned}\]λ§μ§λ§μΌλ‘ μμ°¨μ λν Correlationμ ꡬν΄μ£Όλ©΄ λλ€.
\[\text{PACF}(k) = \text{Cor} \left(e_{s(t)}, e_{s(t-2)} \right)\]Generalization
μ΄μ μΌλ°μ μΈ $\text{PACF}(k)$μ μμμ λν΄ μ λν΄λ³΄μ. μ΄μ λ <Partial Correlation>μ΄λΌλ λ°©μμ μ΅μνλ¦¬λΌ λ―Ώκ³ , λ°λ‘ μμμ μ¨λ³΄κ² λ€.
Definition. Partial ACF
where $\hat{s(t)}$ is a linear combination of $\left\{ s(t-1), s(t-2), β¦, s(t-(k-1))\right\}$ that minimize the mean squared error of $s(t)$ and $s(t-k)$ respectively.
λ§Ίμλ§
ACFμ PACFλ μκ³μ΄ λ°μ΄ν°λ₯Ό EDA νλ κ³Όμ μμ μ¬μ©νλ κΈ°λ² μ€ νλλ€. ACF, PACF κ·Έλνλ₯Ό λ³΄κ³ , μ΄λ€ μκ³μ΄ λͺ¨λΈμ μΈμ§ κ²°μ νκ² λλ€.
ACF, PACFλ₯Ό μ λλ‘ μ°λ €λ©΄ μ΄λ€ μκ³μ΄ λͺ¨λΈλ€μ΄ μλμ§λ₯Ό λ¨Όμ μμμΌ νλ€. μλμ λͺ¨λΈλ€μ λ¨Όμ 곡λΆνκ³ μ€μ.
- AR(Auto-Regressive) Model
- MA(Moving Average) Model
- ARMA Model