Poisson Distribution
โํ๋ฅ ๊ณผ ํต๊ณ(MATH230)โ ์์ ์์ ๋ฐฐ์ด ๊ฒ๊ณผ ๊ณต๋ถํ ๊ฒ์ ์ ๋ฆฌํ ํฌ์คํธ์ ๋๋ค. ์ ์ฒด ํฌ์คํธ๋ Probability and Statistics์์ ํ์ธํ์ค ์ ์์ต๋๋ค ๐ฒ
Poisson Distribution
<ํธ์์ก ๋ถํฌ Poisson Distribution>๋ ์ดํญ ๋ถํฌ $\text{BIN}(n, p)$์ ํน์ํ ๊ฒฝ์ฐ์ด๋ค. $\text{BIN}(n, p)$์์ $n$์ด ๋ฌดํ๋๋ก ์ปค์ง๊ณ , $p$๊ฐ ์์ฃผ์์ฃผ ์์์ง ๋, ๋ถํฌ๋ ํธ์์ก ๋ถํฌ๋ฅผ ๋ง์กฑํ๊ฒ ๋๋ค!
๊ทธ๋ ๋ค๋ฉด ๋ณธ๋ BIN์ด๋๊ฑธ ์ ํธ์์ก ๋ถํฌ๋ก ํด์ํ๋ ๊ฑธ๊น? ์ด ์ง๋ฌธ์ ๋ํ ๋ต์ ์๋์ ์ ํ๋ธ ์์์์ ์ ๋ง ์ ์ค๋ช ํ๊ณ ์๋ค. ํ๋ฒ ๋ณด๊ณ ์ค์.
๐ Youtube - ํธ์์ก๋ถํฌ ์๊ฐ
์ฆ, $n$๊ณผ $p$์ ๊ฐ์ ๋ค๋ฃฐ ์๋ ์๊ณ ์ ์ํ ์๋ ์์ ๋, ํธ์์ก์ $np$๋ฅผ $\lambda$๋ก ๋๊ณ ์๋ก์ด ํํ์ ๋ถํฌ๋ฅผ ์ ๋ํ ๊ฒ์ด๋ค. ๋๋ ํ๊ท ๊ฐ์ธ $\lambda$๋ฅผ ์๋ ์ํ์์ ์ ๋ํ ๋ถํฌ๋ผ๊ณ ๋ณผ ์ ์์ ๊ฒ ๊ฐ๋ค.
Definition. Poisson Distribution
A Poisson random variable $X$ with parameter $\lambda > 0$, denoted as $X \sim \text{POI}(\lambda)$, and it has a pmf $f(x)$ as
\[f(x) = e^{-\lambda} \frac{\lambda^x}{x!} \quad \text{for} \quad x=0, 1, \dots\]์ด ํธ์์ก ๋ถํฌ๊ฐ ์ ๋ง pmf์ธ์ง ๊ฒ์ฆํด๋ณด์. ํ๋ฅ ์ ๅ์ด 1์ด ๋จ์ ๋ณด์ด๋ฉด ๋๋ค.
\[\begin{aligned} \sum f(x) &= e^{-\lambda} \sum_{x=0} \frac{\lambda^x}{x!} \\ &= e^{-\lambda} e^\lambda = 1 \end{aligned}\]์์์ ํธ์์ก ๋ถํฌ๋ ์ดํญ๋ถํฌ์ ํน์ํ ๊ฒฝ์ฐ๋ผ๊ณ ์๊ฐํ๋ค. ์ด๊ฒ์ ํ์ธํด๋ณด์.
Derivation.
Let $X \sim \text{BIN}(n, p) = \text{BIN}(n, \frac{\lambda}{n})$, then pmf $f_n (x)$ is
\[f_n (x) = \binom{n}{x} p^x (1-p)^{n-x} = \binom{n}{x} \left( \frac{\lambda}{n}\right)^x \left( 1 - \frac{\lambda}{n}\right)^{n-x}\]์์ ์์์ $\binom{n}{x}$๋ฅผ ํ์ด์ ์จ๋ณด๋ฉด ์๋์ ๊ฐ๊ณ , ์ด๊ฒ์ ์ ์ ๋ฆฌํด๋ณด์.
\[\begin{aligned} f_n (x) &= \binom{n}{x} \left( \frac{\lambda}{n}\right)^x \left( 1 - \frac{\lambda}{n}\right)^{n-x} \\ &= \frac{n!}{x!(n-x)!} \frac{\lambda^x}{n^x} \left( 1 - \frac{\lambda}{n}\right)^n \left( 1 - \frac{\lambda}{n}\right)^{-x} \\ &= \frac{\lambda^x}{x!} \cdot \left( 1 - \frac{\lambda}{n}\right)^n \cdot \frac{n!}{(n-x)!} \left(\frac{1}{n}\right)^x \left( 1 - \frac{\lambda}{n}\right)^{-x} \end{aligned}\]์ด์ ์์ ์์์ $n \rightarrow \infty$๋ฅผ ์ทจํ์!
\[\begin{aligned} \lim_{n \rightarrow \infty} f_n (x) &= \lim_{n \rightarrow \infty} \frac{\lambda^x}{x!} \cdot \left( 1 - \frac{\lambda}{n}\right)^n \cdot \frac{n!}{(n-x)!} \left(\frac{1}{n}\right)^x \left( 1 - \frac{\lambda}{n}\right)^{-x} \\ &= \lim_{n \rightarrow \infty} \frac{\lambda^x}{x!} \cdot e^{-\lambda} \cdot \frac{n(n-1)\cdots(n-x+1)}{n^x} \cdot \frac{(n-\lambda)^{-x}}{n^{-x}} \\ &= \frac{\lambda^x}{x!} \cdot e^{-\lambda} \cdot 1 \cdot 1 \\ &= \frac{\lambda^x}{x!} e^{-\lambda} \end{aligned}\]$\blacksquare$
์์ ์ ๋ ๊ณผ์ ์์๋ ์ดํญ ๋ถํฌ๋ฅผ ์ฌ์ฉํ์ง๋ง, ๋ฏธ๋ถ๋ฐฉ์ ์์ผ๋ก๋ ํธ์์ก ๋ถํฌ๋ฅผ ์ ๋ํ ์ ์๋ค๊ณ ํ๋ค. ์ ๋ ๊ณผ์ ์ ๋ํ ์์์ ๋งํฌ๋ก ๊ฑธ์ด๋๋ค. ๐ YouTube - ํธ์์ก ๋ถํฌ, ๋ฏธ๋ถ๋ฐฉ์ ์์ผ๋ก ์ ๋
Theorem. Law of Rare Events
$n$์ด ๋ฌดํํ ์ปค์ง๊ฒ ๋๋ฉด, ์์ฐ์ค๋ฝ๊ฒ ํ๋ฅ $p=\dfrac{\lambda}{n}$๋ ์์์ง๊ฒ ๋๋ค. ํ์ง๋ง, ์ดํญ ๋ถํฌ์ ์ฑ์ง์ ๋ฐ๋ผ ์ฌ์ ํ ํ๊ท ๊ณผ ๋ถ์ฐ์ ์๋์ ๊ฐ์ ๊ฒ์ด๋ค.
- $\displaystyle E[X] = \lim_{n\rightarrow\infty} np = \lambda$
- $\displaystyle \text{Var}(X) = \lim_{n\rightarrow\infty} n \frac{\lambda}{n} \left( 1 - \frac{\lambda}{n}\right) = \lambda$
์ด๋ฐ ์ํฉ์ ๋ํด ๊ธฐ์ ํ ์ ๋ฆฌ๊ฐ ๋ฐ๋ก <Law of rare event>์ด๋ค ๐
์์ ๋ช ์ ์ ๋ํ ์ฆ๋ช ์ ํ๊ท ๊ณผ ๋ถ์ฐ์ ์ ์์ ์ ๊ฐํด ์์ ์ ๊ฐํ๋ฉด ๋๋ค. ์ฆ๋ช ์ ์ถํ์ ๊ธฐ์ ํ๊ฒ ๋ค.
Bernoulli Process & Poisson Process
Bernoulli Process
<Poission Process>๋ฅผ ๋ค๋ฃจ๊ธฐ ์ํด์ ๋จผ์ <Bernoulli Process>์ ๋ํด ์์์ผ ํ๋ค.
Definition. Bernoulli Process
The <Bernoulli process> is a sequence of independent Bernoulli trials.
At each trial $X_i$,
- $P(H) = P(X_i = 1) = p$
- $P(T) = P(X_i = 0) = 1-p$
์ฆ, ๋ฒ ๋ฅด๋์ด ์ํ์ Bernoulli RV Sequence $X = \{ X_n : n=1, 2, \dots \}$๋ผ๊ณ ๋ณผ ์ ์๋ค.
\[X_i \sim \text{Ber}(p) \quad \text{and} \quad X \sim \text{BP}(p)\]์ด๋ฐ ๋ฒ ๋ฅด๋์ด ํ๋ก์ธ์ค์ ์๋ก๋
- ๋งค์ผ ์ฝ์คํผ ์ง์์ ์์น/ํ๋ฝ์ ๋ํ binary sequence
- ์ฃผ์ด์ง time interval์ ์ ํธ๊ฐ ์์ ๋๋์ง ์๋์ง์ ๋ํ binary seq.
Poisson Process
์ด๋ฒ์๋ BP์์ ๊ทนํ์ ์ทจํด time intervel์ ๊ฐ๊ฒฉ์ ์์ฃผ์์ฃผ ์ค์ธ, ๊ทธ๋์ ๊ฒฐ๊ตญ continuousํ ์๊ฐ์ถ ์์์ ์ํ๋๋ <Poisson Process>์ ๋ํด ์ดํด๋ณด์. ์๋์ ๊ธฐ์ ๋๋ ๋ด์ฉ์ ์๋์ ์ ํ๋ธ ์์์ ๊ธฐ์ค์ผ๋ก ์์ฑํ์๋ค.
๐ YouTube - Definition of the Possion Process
๋จผ์ $N(t)$ ๋๋ $N_t$๋ฅผ ์ ์ํ์. ์ด๊ฒ์ $t$์๊ฐ๊น์ง ๋์ฐฉํ ์ฌ๊ฑด์ ๊ฐฏ์๋ฅผ ์๋ฏธํ๋ RV์ด๋ค. BP์์์ ์ฑ์ง๋ค์ ๋ฐํ์ผ๋ก <Poisson Process>๋ฅผ ์ ์ ์ํด๋ณด์.
1. ๊ฐ time slot์ ์๋ก ๋ ๋ฆฝ์ด๋ค.
Poisson Process๋ ์ด ์ฑ์ง์ ๊ฐ์ง๋ฏ๋ก, ์๋์ ๋ช ์ ๊ฐ ์ฑ๋ฆฝํ๋ค.
โ# of arrivals in disjoint time inteverals are independent.โ
์ด๊ฒ์ ์์์ผ๋ก ํํํ๋ฉด ์๋์ ๊ฐ๋ค.
\[\left( N(t_2) - N(t_1) \right) \perp \left( N(t_4) - N(t_3) \right)\]2. (Time homogeneity) ๊ฐ time slot์์ arrival์ด ๋ฐ์ํ ํ๋ฅ ์ด ๋์ผํ๋ค.
๋ง์ฐฌ๊ฐ์ง๋ก BP์์ ๊ฐ time slot๋ง๋ค ๋ชจ๋ ํ๋ฅ $p$๋ฅผ ๊ฐ์ก๊ธฐ ๋๋ฌธ์ Poission Process๋ ์ด ์ฑ์ง์ ๊ฐ์ง๋ค. ์ด๊ฒ์ ๊ธฐ์ ํ๋ฉด,
โ$P(k, \tau)$, the prob. of $k$ arrivals in interval of duration $\tau$ is constantโ
๊ทธ๋ฆฌ๊ณ $P(k, \tau)$์ ๋ํด ์ด๊ฒ์ $k$์ ๋ํด ๋ชจ๋ ๋ํ๋ฉด, ๊ทธ ํ๋ฅ ์ ๅ์ 1์ด ๋๋ค.
\[\sum^{\infty}_{k=0} P(k, \tau) = 1\]์์ ์์ ์ด๊ฑธ ์กฐ๊ธ ๋ค๋ฅด๊ฒ ๊ธฐ์ ํ ๊ฒ ๊ฐ๋ค. โThe distribution of $N(t) - N(s)$ only depends on $(t-s)$โ
\[N(t) - N(s) = N(t-s)\]3. small interval probability
โ๋ arrival์ด ๋์ผํ ์๊ฐ์ ๋์์ ๋ฐ์ํ๋ค.โ ์ด๋ฐ ๊ฒฝ์ฐ๋ฅผ ์๊ฐํ ์ ์์๊น? ํ์ค์์๋ ์ด๋ฐ โSame Time, Same place, Same Eventโ๊ฐ ์ผ์ด๋๋ ๊ฑด ๋ถ๊ฐ๋ฅํ๋ค. Poission Process๋ ์ด๋ฐ ๋์์ ๋ฐ์ํ๋ ์ฌ๊ฑด์ ์์ ๊ธฐ ์ํด ์์ฃผ ์์ interval $\delta$์ ๋ํด ์๋์ ๊ฐ์ด ์ ์ํ๋ค.
\[P(k, \delta) \approx \begin{cases} 1 - \lambda \delta & \text{if} \quad k=0 \\ \lambda \delta & \text{if} \quad k=1 \\ 0 & \text{if} \quad k > 1 \end{cases}\]์ ๋ฆฌํ๋ฉด, ์์ ๊ฐ์ 3๊ฐ์ง ์กฐ๊ฑด์ ๋ง์กฑํ๋ค๋ฉด ์ฐ๋ฆฌ๋ ๊ทธ ๊ณผ์ ์ <Poisson Process>๋ผ๊ณ ํ๋ค!
์ ๊น ๋ค์ <Bernoulli Process>์ ์๊ฐ์ผ๋ก ๋์์๋ณด์. $[0, t]$ ๊ฐ๊ฒฉ์ ๊ฐ์ง๋ ํ๋ฅ ๋ณ์ $X$๊ฐ ์๋ค๊ณ ํ์. ๊ทธ๋ฌ๋ฉด, ์ด๊ฒ์ ํ๋ฅ ์
\[\begin{cases} P(X = 1) = \lambda t + o(h) \\ P(X = 0) = 1 - \lambda t + o(h) \end{cases}\]์ด๋ $X_i$๋ฅผ โ# of buses that arrive in $[t_i, t_{i+1}]$โ๋ผ๊ณ ์ ์ํ๋ค๋ฉด, $X_i$์ ๋ํ ๋ถํฌ๋ Bernoulli Distribution์ ๋ฐ๋ฅธ๋ค.
\[\begin{cases} P(X = 1) = \lambda \cdot \dfrac{t}{n} + o(h) \\ P(X = 0) = 1 - \lambda \cdot \dfrac{t}{n} + o(h) \end{cases}\] \[X_i \sim \text{Bernoulli}\left( \frac{\lambda t}{n} \right)\]์ด๋, $N(t) = X_1 + \cdots + X_n$๋ก ๋๋ค๋ฉด, $N(t)$๋ Binomial Distribution $\text{BIN}(n, \lambda t/n)$์ ๋ฐ๋ฅด๊ฒ ๋๋ค.
\[X_1 + \cdots + X_n = N(t) \sim \text{BIN}(n, \lambda t/n)\]์ด๋, ์ฐ๋ฆฌ๊ฐ $n \rightarrow \infty$๋ก ๋ณด๋ด๊ณ $[t_i, t_{i+1}] \rightarrow 0$๊ฐ ๋๋ค๋ฉด, ์์์ ์ธ๊ธํ <Law of Rare event>์ ์ํด Binomial Distribution์ด Poisson Distribution์ด ๋๋ค.
\[\text{BIN}(n, \lambda t/n) \approx \text{POI}(\lambda t)\]์ ๋ฆฌํ๋ฉด, $N(t)$๋ฅผ ๋ชจ์ sequence $\{ N(t) : t \ge 0\}$๋ <Possion Process>๋ค. ๊ทธ๋ฆฌ๊ณ ๊ฐ๋ณ $N(t)$๋ <Poission Distribution>์ ๋ฐ๋ฅธ๋ค. ๐คฉ
\[N(t) \sim \text{POI}(\lambda t)\]Example.
Let $T$ be the time that the 1st bus arrives. What is the distribution of $T$? (We know that the average arrival time is $\lambda$)
์ฃผ์ํ ์ ์ ์์์ ์ดํด๋ณธ <Geometric Distribution>์ฒ๋ผ 1st event case๋ฅผ ๊ตฌํ๋ ๋ฌธ์ ์ด์ง๋ง, Sample Space๊ฐ ์ด์ฐ์ด ์๋๋ผ ์ฐ์์ธ time axis๋ผ๋ ์ ์ด๋ค!!
๋จผ์ cdf $P(T \le t)$๋ฅผ ๊ตฌํด๋ณด์. $P(T \le t)$๋ฅผ ์ง์ ๊ตฌํ์ง ๋ง๊ณ , ๋ฐ๋ ์ผ์ด์ค์ธ $P(T > t)$๋ฅผ ์ด์ฉํด ์ ๋ํด๋ณด์.
$P(T > t)$, ์ฆ ๊ธฐ๋ค๋ฆฌ๋ ์๊ฐ $T$๊ฐ $t$๋ณด๋ค ์ปค์ง ํ๋ฅ ์ ๊ณง $t$ ์๊ฐ๊น์ง ๋์ฐฉํ ๋ฒ์ค์ ์๊ฐ 0์ด ๋ ํ๋ฅ ๊ณผ ๊ฐ๋ค. ์ฆ, $N(t) = 0$์ ํ๋ฅ ๊ณผ ๊ฐ๋ค. ๋ฐ๋ผ์,
\[P(T > t) = P(N(t) = 0) = e^{-\lambda t} \frac{(\lambda t)^0}{0!} = e^{-\lambda t}\]๋ฐ๋ผ์, $P(T \le t) = 1 - e^{-\lambda}$์ด๋ค. ์ด๊ฒ์ ๋ฏธ๋ถํ๋ฉด pdf $f(x)$๋ฅผ ์ป์ ์ ์๋ค.
\[\frac{d}{dt} P(T \le t) = \frac{d}{dt} (1 - e^{-\lambda t}) = \lambda \cdot e^{-\lambda t}\]๋ค์์ ๋ค๋ฃจ๊ฒ ์ง๋ง, ์์ ๊ฐ์ pdf๋ฅผ ๊ฐ์ง๋ continuous distribution์ <Exponential Distribution>์ด๋ผ๊ณ ํ๋ค.
์ด๋ฒ ํฌ์คํธ์์ ๋ค๋ฃฌ <Poisson Distribution>์ ๋์ผ๋ก ๊ต์ฌ์์ ๋ค๋ฃจ๋ ๋ชจ๋ ์ด์ฐ ํ๋ฅ ๋ถํฌ๋ฅผ ์ดํด๋ณด์๋ค. ๋ค์ ํฌ์คํธ๋ถํฐ๋ ์ฐ์ RV๊ฐ ๊ฐ๋ <์ฐ์ ํ๋ฅ ๋ถํฌ; Continuous Distribution>์ ์ดํด๋ณด๊ฒ ๋ค.
- Continuous Probability Distribution