Two Samples Estimation: Paired Observations
โํ๋ฅ ๊ณผ ํต๊ณ(MATH230)โ ์์ ์์ ๋ฐฐ์ด ๊ฒ๊ณผ ๊ณต๋ถํ ๊ฒ์ ์ ๋ฆฌํ ํฌ์คํธ์ ๋๋ค. ์ ์ฒด ํฌ์คํธ๋ Probability and Statistics์์ ํ์ธํ์ค ์ ์์ต๋๋ค ๐ฒ
Interval Estimation ํฌ์คํธ์์ ๋ค๋ฃฌ <Interval Estimation>์ ํน์ ์ํฉ์ ์ด๋ป๊ฒ ์ ์ฉํ ์ ์๋์ง๋ฅผ ๋ค๋ฃจ๋ ํฌ์คํธ์ ๋๋ค.
์๋์ ๋ฌธ์ ๋ฅผ ์ดํด๋ณด์!
์ฐ๋ฆฌ๋ ํ์1๋ถํฐ ํ์30๊น์ง ๊ทธ๋ค์ TOEIC ์ ์์ before-after๋ฅผ ๊ฐ์ง๊ณ ์๋ค. ์ฐ๋ฆฌ๋ ๊ณผ์ฐ MATH230 ์์ ์ด ํ์๋ค์ TOEIC ์์ ์ ์ด๋ค ์ํฅ์ ๋ฏธ์น๋์ง ์๊ธฐ ์ํด $\mu_1 - \mu_2$๋ฅผ ์ถ์ ํ๊ณ ์ ํ๋ค!!
Q. Can we find a 95% confidence interval for the true mean of the differences btw the scores before and after the MATH230?
Supp. $X_1, \dots, X_n$ and $Y_1, \dots, Y_n$ are random samples and $\sigma_1^2$ and $\sigma_2^2$ are known.
์ด์ ํฌ์คํธ โTwo Samples Estimation: Diff Btw Two Meansโ์์ ๋ง์ฝ ๋ ์ํ์ ๋ถ์ฐ์ ์ ํํ ์๋ค๋ฉด, ์๋์ ๊ฐ์ด ๊ตฌ๊ฐ์ ์ถ์ ํ ์ ์๋ค๊ณ ํ์๋ค.
\[\left| \bar{x} - \bar{y} \right| \le z_{\alpha/2} \cdot \sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{n}}\]๐ฅ ํ!์ง!๋ง! ์์ ๋ฐฉ๋ฒ์ ์ฌ๋ฐ๋ฅธ ์ ๊ทผ์ด ์๋๋ค! ์๋ํ๋ฉด, ํ์ฌ ์ฐ๋ฆฌ๊ฐ ๊ฐ์ง ์ํ $X_i$, $Y_i$์ ๋ํด ๊ทธ ๋์ด ์๋ก dependent ํ๊ธฐ ๋๋ฌธ์ด๋ค!! ์์ ์ ๊ทผ์ $X_i$์ $Y_i$๊ฐ independent ํ ๋๋ง ๊ฐ๋ฅํ๋ค!!
๊ทธ๋์ ์ฐ๋ฆฌ๋ ๊ฐ $X_i$, $Y_i$๋ฅผ ๊ฐ๋ณ์ ์ผ๋ก ์๊ฐํ๋ ๊ฒ์ด ์๋๋ผ ๊ทธ๋ค์ paringํ Difference $D_i = X_i - Y_i$๋ก ์ ๊ทผํ๊ณ ์ ํ๋ค!
์ด๋ ๊ฒ ํ ๊ฒฝ์ฐ, ๊ฐ Pair๋ ์๋ก independentํ๊ฒ ๋๋ค!
Assume that $D_1, \dots, D_n$ are normal random samples: $D_i \sim N(\mu_D, \sigma_D^2)$
To find the confidence interval for $\mu_1 - \mu_2$, we use $\bar{D} := \bar{X} - \bar{Y}$.
Then, by CLT
\[\frac{\bar{D} - \mu_D}{\sigma_D / \sqrt{n}} \; \sim \; N(0, 1)\]์ด๋, ์ฐ๋ฆฌ๋ $\sigma_D^2$๋ฅผ ์์ง ๋ชปํ๋ฏ๋ก ์ด๊ฒ์ sample variance $s_D^2$์ผ๋ก ๊ต์ฒดํ๋ฉด ๋ถํฌ๋ ์๋์ ๊ฐ๋ค.
\[\frac{\bar{D} - \mu_D}{s_D / \sqrt{n}} \; \sim \; t(n-1)\]์ง๊ธ๊น์ง๋ <Normal Distribution>์์ ๋ฝ์ random sample์์ ์ถ์ (Estimation)์ ์งํํ๋ค. ๋ค์ ํฌ์คํธ์์๋ <Bernoulli Distribution>์์ ์ํํ๋ ์ถ์ ์ธ <Proportion Estimation>์ ๋ํด ์ดํด๋ณธ๋ค!! (Binomial Distribution์์์ ํ๊ท ์ Proportion์ด๋ค!! ๐)