Bayesโ Rule
โํ๋ฅ ๊ณผ ํต๊ณ(MATH230)โ ์์ ์์ ๋ฐฐ์ด ๊ฒ๊ณผ ๊ณต๋ถํ ๊ฒ์ ์ ๋ฆฌํ ํฌ์คํธ์ ๋๋ค. ์ ์ฒด ํฌ์คํธ๋ Probability and Statistics์์ ํ์ธํ์ค ์ ์์ต๋๋ค ๐ฒ
Law of Total Probability
Definition. Partition
The events $\{ B_1, \dots, B_n \}$ form a partition of event space $S$ if
- $B_i \cap B_j = \emptyset$ for any $i \ne j$
- $\cup^n_{i=1} B_i = S$
Theorem. Law of Total Probability
If the events $B_1$, โฆ, $B_n$ form a partition of $S$ such that $P(B_i) > 0$,
then for any event $A$
\[P(A) = \sum^{n}_{i=1} P(A \cap B_i)\]<์ ์ฒด ํ๋ฅ ์ ๋ฒ์น; Law of Total Probability>๋ <Rule of Elimination>๋ผ๊ณ ๋ ํ๋ค.
Bayesโ Rule
Theorem. Bayesโ Rule
If the events $B_1$, $B_2$, โฆ, $B_k$ be a partition of event space $S$,
then for any event $A$ with $P(A) > 0$
\[P(B_k \mid A) = \frac{P(B_k \cap A)}{P(A)} = \frac{P(A \mid B_k)P(B_k)}{\sum^{n}_{i=1} P(A \mid B_i)P(B_i)}\]proof.
์ฆ๋ช ์ ๊ฐ๋จํ๋ค.
[Step 1] Conditional Probability์ ๋ฐ๋ผ ์๋์ ์์ด ์ฑ๋ฆฝํ๋ค.
\[P(B_k \cap A) = P(B_k \mid A) P(A) = P(A \mid B_k) P(B_k)\]์์ ์ฝ๊ฐ ๋ค์์ผ๋ฉด ์๋๋ฅผ ์ ๋ํ ์ ์๋ค.
\[P(B_k \mid A) = \frac{P(B_k \cap A)}{P(A)}\][Step 2] Law of Total Probability์ ๋ฐ๋ผ ๋ถ๋ชจ์ $P(A)$๋ฅผ ์๋์ ๊ฐ์ด ๋ฐ๊ฟ ์ ์๋ค.
\[\frac{P(B_k \cap A)}{P(A)} = \frac{P(B_k \cap A)}{\sum^{n}_{i=1} P(A \cap B_i)}\][Step 3] ๋ค์ Conditional Probability์ ์ ์๋ฅผ ์ด์ฉํ๋ฉด, ์ต์ข ์ ์ผ๋ก ์๋์ ๊ฒฐ๊ณผ๋ฅผ ์ป๋๋ค.
\[\frac{P(B_k \cap A)}{\sum^{n}_{i=1} P(A \cap B_i)} = \frac{P(B_k \cap A)}{\sum^{n}_{i=1} P(A \mid B_i)P(B_i)}\]Applications of Bayes Rule
<Bayes Rule> ์์ฒด๋ ์ด๋ ต์ง ์๋ค. ๊ทธ๋ฌ๋ <Bayes Rule>์ ์์ ์ ์ธ์ /์ด๋ป๊ฒ ์ด๊ฑธ ์จ์ผ ํ๋์ง๋ฅผ ํ์คํ ์๋๊ฒ ์ค์ํ๋ค. ๐
์ ๋ณ ๊ฒ์ฌ
๊ฑด๊ฐํ ์ฌ๋๊ณผ ํน์ ์ง๋ณ์ด ์๋ ์ฌ๋์ ๊ตฌ๋ณํ๊ธฐ ์ํด ์ํํ๋ ๊ฒ์ฌ๋ฅผ <์ ๋ณ ๊ฒ์ฌ; Screening Test>๋ผ๊ณ ํ๋ค. ์ ๋ณ ๊ฒ์ฌ์์ ์ด์์ด ๋ํ๋๋ฉด, ์ ๋ฐ ๊ฒ์ฌ๋ฅผ ํตํด ์ง๋ณ์ ์ ๋ฌด๋ฅผ ํ๋จํ๋ค.
๊ฑด๊ฐํ ๋ธํผ์ ์์นจ๋ถํฐ ๋ชฉ์ด ์ํ๊ธฐ ์์ํ๋ค. ํน์ ์ฝ๋ก๋์ ๊ฑธ๋ ธ๋ ์ถ์ด์ ์์นจ์ ์๊ฐ๊ฒ์ฌํคํธ๋ฅผ ์ฌ์ ํด๋ดค๋๋ ์ด๋ด์๊ฐ! ์์ฑ(+)์ด ๋ด๋ค!
2022๋ ๋ํ๋ฏผ๊ตญ์์ ์ฝ๋ก๋ ๊ฑธ๋ฆด ํ๋ฅ $P(C)$๋ $0.4$๋ผ๊ณ ํ์. ๊ทธ๋ฆฌ๊ณ ์๊ฐ๊ฒ์ฌํคํธ์ ์ ํ๋๋ฅผ ๊ณ์ฐ ํด๋ณด๋ฉด
- ์ฝ๋ก๋์ ๊ฑธ๋ฆฐ ์ฌ๋์ด ์์ฑ์ผ๋ก ๋์ฌ ํ๋ฅ $P(+ \mid C)$์ $0.95$
- ์ฝ๋ก๋์ ๊ฑธ๋ฆฌ์ง ์์ ์ฌ๋์ด ์์ฑ์ผ๋ก ๋์ฌ ํ๋ฅ ์ $P(+ \mid \sim C)$์ $0.01$
๋ผ๊ณ ํ์. ๋ธํผ์ โ์ฌ์ค ์ฝ๋ก๋์ ๊ฑธ๋ฆฌ์ง ์์ ๊ฑด๋ฐ ์์ฑ์ด ๋ฌ ๊ฒ์ผ ์๋ ์๋คโ๊ณ ์๊ฐํ๋ฉฐโ ์๊ฐ๊ฒ์ฌํคํธ์ ์ ํ๋๋ฅผ ์์ฌํ๊ณ ์๋ค. ๋ธํผ์ ์ํด ์๊ฐ๊ฒ์ฌ ์์ฑ์ธ๋ฐ ์ฝ๋ก๋์ ๊ฑธ๋ ธ์ ํ๋ฅ $P(C \mid +)$๋ฅผ ๊ตฌํด๋ณด์.
By Bayesโ Rule,
\[\begin{aligned} P(C \mid +) &= \frac{P(+ \mid C) P(C)}{P(+)} = \frac{P(+ \mid C) P(C)}{P(+ \mid C)P(C) + P(+ \mid \sim C)P(\sim C)} \\ &= \frac{0.95 \cdot 0.4}{0.95 \cdot 0.4 + 0.01 \cdot 0.6} = \frac{0.38}{0.386} \\ &= 0.98 \end{aligned}\]์โฆ ์์ฝ์ง๋ง, ์๊ฐ๊ฒ์ฌ๊ธฐํธ์์ ์์ฑ์ด ๋์๋ค๋ฉด, ๋ธํผ์ ์ ๋ง๋ก ์ฝ๋ก๋์ ๊ฑธ๋ ธ์ ํ๋ฅ ์ด ๋ฌด์ง๋ฌด์ง ๋์ ๊ฒ์ด๋ค!!
Meaning of Bayes Rule
๋ฒ ์ด์ฆ ์ ๋ฆฌ๋ ์ด๋ฒคํธ์ ๋ํ ์์ธ์ ๊ท๋ช ํ๋ ๋๊ตฌ์ด๋ค. ์ด๋ค ์ด๋ฒคํธ๊ฐ ์ผ์ด๋๋ ๊ฒ์๋ ์์ธ์ด ์๋ค. ์ด ์์ธ๋ค์ 2๊ฐ๊ฐ ๋์์ ๋ฐ์ํ์ง๋ ์๋ Exclusive ํ๋ค๊ณ ๊ฐ์ ํ๋ค.
๋ฒ ์ด์ฆ ์ ๋ฆฌ๋ฅผ ๊ด์ธก(evidence)์ ๋ฐ๋ฅธ ๋ฏฟ์(belief)์ ๋ณํ๋ก ์ดํดํ ๊ฒ์ด <Bayesian; ๋ฒ ์ด์ฆ ์ฃผ์์>๋ค์ด๋ค.
์์์ ์ดํด๋ณธ โ์ฝ๋ก๋์ ๊ฑธ๋ฆฐ ๋ธํผโ์ ์์๋ฅผ ๋ค์ ๋ณด์. ๊ทธ๋ ํคํธ๋ก ์์ฑ(+) ํ์ ์ ๋ฐ๊ธฐ ์ ์๋ ์์ ์ ๊ฐ๊ธฐ๊ฐ ์ฝ๋ก๋์ผ ๊ฑฐ๋ผ๋ ๋ฏฟ์์ด $P(C) = 0.4$์ ๋ถ๊ณผ ํ๋ค. ์ด๊ฑธ ์ฌ์ ํ๋ฅ (Prior Probability)๋ผ๊ณ ํ๋ค. ๊ทธ๋ฌ๋ ํคํธ๋ก ์์ฑ ํ์ ์ ๋ฐ์ ํ์๋ ์์ ์ด ์ฝ๋ก๋์ ๊ฑธ๋ ธ์ ๊ฑฐ๋ผ๋ ๋ฏฟ์ $P(C \mid +)$์ด $0.98$๋ก ์น์์๋ค! ์ด๊ฑธ ์ฌํ ํ๋ฅ (Posterir Probability)๋ผ๊ณ ํ๋ค.
<๋ฒ ์ด์ฆ ์ฃผ์์>๋ผ๋ ๊ฒ ์ฌ์ค์ ๊ทธ๋ฆฌ ๋๋จํ ์กด์ฌ๋ค์ด ์๋๋ค. ๊ด์ฐฐ๋ ์ฌ์ค์ ๋ฐํ์ผ๋ก ๋ณธ์ธ์ ๋ฏฟ์์ ๊ฐฑ์ ํ๋ ์ฌ๋์ด๋ผ๋ฉด ๋ชจ๋๊ฐ <๋ฒ ์ด์ฆ ์ฃผ์์>์ด๋ค! ๋ฒ ์ด์ฆ ์ฃผ์์ ๋ง์ธ!
๋งบ์๋ง
์ด๋ฒ์ ์ดํด๋ณธ <๋ฒ ์ด์ฆ ๊ท์น>์ <๋ฒ ์ด์ฆ ํต๊ณํ; Bayesian Statistics>๋ผ๋ ํต๊ณํ ๋ถ์ผ์ ์ฒซ ๊ฑธ์์ด๋ค. โ๋ฏฟ์์ ์๋ฃ๋ฅผ ๋ฐ์ํด ๋ฏฟ์์ ๊ฐฑ์ ํ๋คโ๋ ์์ด๋์ด์ ๊ด์ฌ์ด ์๋ค๋ฉด, ๋ฒ ์ด์ง์์ ๊ณต๋ถํด๋ณด์!
์์ฝ์ง๋ง ํ๊ต์์ ๋ค์ โํ๋ฅ ๊ณผ ํต๊ณ(MATH230)โ์์ ๋ฒ ์ด์ง์์ด ๋ฑ์ฅํ๋ ๊ฑด <Bayesโ Rule> ๋ฟ์ด๋ค. ์ด๊ฒ๋ง ์๊ณ ๊น๋จน์ผ๋ฉด ๋๋ค ์คํ๋ ค ๋จธ์ ๋ฌ๋์ด๋ ์ธ๊ณต์ง๋ฅ ์์
์์ ๋ฒ ์ด์ง์์ ๋ํ ์ด๋ก ์ ๋ ๊ณต๋ถํ ๊ฒ ๊ฐ๋ค. ํผ์ข
์ํ์๊ฐ ๋์ด๋ณด์!!
<Bayesโ Rule>์ ํ์ฉํ ์ฌ๋ฐ๋ ๋ฌธ์ ๊ฐ ์๋ค! <๋ชฌํฐ ํ ๋ฌธ์ ; Monti Hall Problem>์ด๋ผ๋ ๋ฌธ์ ๊ฐ ์๋ค. ๋ ๋งํ๋ฉด ์คํฌ๊ฐ ๋ ๊ฒ ๊ฐ์ผ๋ ๊ถ๊ธํ๋ค๋ฉด ํ๋ฒ ๋์ ํด๋ณด์!
๐ Monti Hall Problem