β€œν™•λ₯ κ³Ό 톡계(MATH230)” μˆ˜μ—…μ—μ„œ 배운 것과 κ³΅λΆ€ν•œ 것을 μ •λ¦¬ν•œ ν¬μŠ€νŠΈμž…λ‹ˆλ‹€. 전체 ν¬μŠ€νŠΈλŠ” Probability and Statisticsμ—μ„œ ν™•μΈν•˜μ‹€ 수 μžˆμŠ΅λ‹ˆλ‹€ 🎲

6 minute read

β€œν™•λ₯ κ³Ό 톡계(MATH230)” μˆ˜μ—…μ—μ„œ 배운 것과 κ³΅λΆ€ν•œ 것을 μ •λ¦¬ν•œ ν¬μŠ€νŠΈμž…λ‹ˆλ‹€. 전체 ν¬μŠ€νŠΈλŠ” Probability and Statisticsμ—μ„œ ν™•μΈν•˜μ‹€ 수 μžˆμŠ΅λ‹ˆλ‹€ 🎲

Memoryless Property

μ–΄λ–€ ν™•λ₯  뢄포가 Memoryless Property(κΈ°μ–΅ μ—†μŒ μ„±μ§ˆ)λ₯Ό 가진닀면, λ‹€μŒ 쑰건을 λ§Œμ‘±ν•©λ‹ˆλ‹€.

\[P(X > a + t \mid X > a) = P(X > t)\]

μ΄λŠ” β€œμ΄λ―Έ $a$만큼 μ‹œκ°„μ΄ 지났더라도 남은 μ‹œκ°„ $t$ λ™μ•ˆ 사건이 λ°œμƒν•˜μ§€ μ•Šμ„ ν™•λ₯ μ€ μ²˜μŒλΆ€ν„° $t$ μ‹œκ°„ 만큼 기닀릴 λ•Œμ™€ λ™μΌν•˜λ‹€β€λŠ” μ˜λ―Έμž…λ‹ˆλ‹€. 즉, ν˜„μž¬κΉŒμ§€ μ–Όλ§ˆλ‚˜ κΈ°λ‹€λ ΈλŠ”μ§€μ™€ 관계없이 남은 λŒ€κΈ° μ‹œκ°„μ΄ λ™μΌν•œ ν™•λ₯  뢄포λ₯Ό λ”°λ₯Έλ‹€λŠ” νŠΉμ§•μ„ κ°€μ§‘λ‹ˆλ‹€.

μ§€μˆ˜ 뢄포(Exponential Distribution)κ°€ μœ„μ˜ Memoryless Propertyλ₯Ό λ§Œμ‘±ν•˜λŠ”μ§€ 확인해 λ΄…μ‹œλ‹€.

\[\begin{aligned} P(X > a + t \mid X > a) &= \frac{P(X > a + t)}{P(X > a)} \\ &= \frac{e^{-\lambda (a+t)}}{e^{-\lambda a}} \\ &= e^{-\lambda t} = P(X > t) \end{aligned}\]

λ”°λΌμ„œ, μ§€μˆ˜ 뢄포(Exponential Distribution)λŠ” Memoryless Propertyλ₯Ό κ°€μ§‘λ‹ˆλ‹€! πŸš€

Example

μ–΄λ–€ μ „κ΅¬μ˜ 수λͺ…이 μ§€μˆ˜ 뢄포λ₯Ό λ”°λ₯Έλ‹€κ³  ν•©λ‹ˆλ‹€. 즉, 전ꡬ가 μ–Έμ œ κ³ μž₯λ‚ μ§€λŠ” μ™„μ „νžˆ 랜덀이고, ν‰κ· μ μœΌλ‘œ $1/\lambda$ μ‹œκ°„λ§ˆλ‹€ κ³ μž₯ λ‚œλ‹€κ³  ν•©λ‹ˆλ‹€.

μ§€κΈˆκΉŒμ§€ 100μ‹œκ°„ λ™μ•ˆ 전ꡬ가 κ³ μž₯λ‚˜μ§€ μ•Šμ•˜λ‹€κ³  ν•©λ‹ˆλ‹€. 그럼 μ§€κΈˆλΆ€ν„° $t$μ‹œκ°„ 더 전ꡬ가 μ§€μ†ν• μ§€λŠ”

  • β€œμ΄ μ „κ΅¬λŠ” 이미 100μ‹œκ°„μ΄λ‚˜ λ²„ν…ΌμœΌλ‹ˆκΉŒ μ•žμœΌλ‘œλ„ ν•œμ°Έ 더 버티겠지?” ❌ (이건 ν‹€λ¦° 생각!)
  • β€œμ΄ μ „κ΅¬λŠ” 처음 샀을 λ•Œλž‘ λ˜‘κ°™μ€ ν™•λ₯ λ‘œ μ•žμœΌλ‘œλ„ κ³ μž₯이 λ‚  κ±°μ•Ό.” βœ… (이게 λ§žλŠ” 생각!)

Relationship with Geometric Distribution

μš°λ¦¬λŠ” μ–΄λ–€ 사건이 처음으둜 λ°œμƒν•˜λŠ” μ‹œν–‰ 횟수 $X$λ₯Ό λͺ¨λΈλ§ν•œ Geometric Distribution을 μ‚΄νŽ΄λ³Έ 적이 μžˆμŠ΅λ‹ˆλ‹€.

κΈ°ν•˜ 뢄포 μ—­μ‹œ Memoryless Propertyλ₯Ό λ§Œμ‘±ν•©λ‹ˆλ‹€. 즉, 이미 λͺ‡ 번의 μ‹œν–‰μ΄ μ§„ν–‰λ˜μ—ˆλ“  상관없이, μ•žμœΌλ‘œ 사건이 처음 λ°œμƒν•˜κΈ°κΉŒμ§€ κ±Έλ¦¬λŠ” μ‹œν–‰ 횟수의 ν™•λ₯ μ€ 항상 λ™μΌν•©λ‹ˆλ‹€. λ†€λžκ²Œλ„, κΈ°ν•˜ λΆ„ν¬μ—μ„œ μ§€μˆ˜ λΆ„ν¬μ˜ Memoryless μ„±μ§ˆμ„ μœ λ„ν•  μˆ˜λ„ μžˆμŠ΅λ‹ˆλ‹€!

ν™•λ₯  λ³€μˆ˜ $X_n$을 β€œκ° μ‹œν–‰ 간격이 $1/n$초일 λ•Œ, λ²„μŠ€κ°€ 처음 도착할 λ•ŒκΉŒμ§€ κ±Έλ¦° μ‹œν–‰ νšŸμˆ˜β€λΌκ³  μ •μ˜ν•©μ‹œλ‹€. 즉, 맀 $1/n$μ΄ˆλ§ˆλ‹€ λ²„μŠ€κ°€ λ„μ°©ν–ˆλŠ”μ§€ ν™•μΈν•˜λ©°, $X_n$은 처음으둜 λ²„μŠ€λ₯Ό λ°œκ²¬ν•˜κΈ°κΉŒμ§€μ˜ μ‹œν–‰ 횟수λ₯Ό λ‚˜νƒ€λƒ…λ‹ˆλ‹€. λ˜ν•œ, $X$λ₯Ό β€œλ²„μŠ€κ°€ 처음 도착할 λ•ŒκΉŒμ§€ κ±Έλ¦° μ‹€μ œ μ‹œκ°„β€μ΄λΌκ³  μ •μ˜ν•©λ‹ˆλ‹€.

즉, $X_n$이 ν•œ 번 증가할 λ•Œλ§ˆλ‹€ μ‹€μ œ μ‹œκ°„ $X$λŠ” $1/n$μ΄ˆμ”© μ¦κ°€ν•˜λ―€λ‘œ,

\[X = \frac{X_n}{n}\]

κ°€ λ©λ‹ˆλ‹€. 이λ₯Ό λΉ„λ‘€μ‹μœΌλ‘œ ν‘œν˜„ν•˜λ©΄ λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€.

\[X_n : X = 1 : \frac{1}{n}\]

즉, $X_n$은 μ‹œν–‰ 횟수λ₯Ό λ‚˜νƒ€λ‚΄λŠ” 이산 ν™•λ₯  λ³€μˆ˜μ΄λ©°, $X$λŠ” 연속적인 μ‹œκ°„ λ³€μˆ˜μž…λ‹ˆλ‹€. 이제 $X_n$이 μ–΄λ–€ ν™•λ₯  뢄포λ₯Ό λ”°λ₯΄λŠ”지 μ‚΄νŽ΄λ΄…μ‹œλ‹€.


$X_n$λŠ” κΈ°ν•˜ 뢄포(Geometric Distribution)λ₯Ό λ”°λ₯΄λŠ” ν™•λ₯  λ³€μˆ˜ μž…λ‹ˆλ‹€.

\[X_n \sim \text{Geo}(p_n)\]

μ—¬κΈ°μ„œ $p_n$은 맀 μ‹œν–‰(즉, $1/n$μ΄ˆλ§ˆλ‹€) λ²„μŠ€κ°€ 도착할 ν™•λ₯ μ„ μ˜λ―Έν•©λ‹ˆλ‹€. μ΄λ•Œ, $n$을 μΆ©λΆ„νžˆ 크게 λ§Œλ“€λ©΄, 즉 μ‹œν–‰ 간격을 맀우 짧게 ν•˜λ©΄, 이산적인 κΈ°ν•˜ 뢄포가 연속적인 μ§€μˆ˜ λΆ„ν¬λ‘œ μˆ˜λ ΄ν•  κ²ƒμž„μ„ κΈ°λŒ€ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

이제 이 과정을 μˆ˜μ‹μ μœΌλ‘œ 정리해 λ΄…μ‹œλ‹€.

  • $X_n$이 κΈ°ν•˜ 뢄포λ₯Ό λ”°λ₯Έλ‹€λ©΄, $X_n \sim \text{Geo}(p)$.
  • κΈ°λŒ“κ°’μ€ $E[X_n] = 1/p$μ΄λ―€λ‘œ, 졜초의 λ²„μŠ€κ°€ λ„μ°©ν•˜λŠ” κ±Έ ν™•μΈν•˜κΈ° μœ„ν•΄ ν‰κ· μ μœΌλ‘œ $1/p$번 확인을 ν•©λ‹ˆλ‹€.
  • 이λ₯Ό μ‹œκ°„ $X$의 κ΄€μ μ—μ„œ 보면, ν‰κ· μ μœΌλ‘œ $\frac{1}{p} \cdot \frac{1}{n} = 1/(np)$μ΄ˆκ°€ κ±Έλ¦½λ‹ˆλ‹€.

즉,

\[\beta = \frac{1}{np}, \quad \lambda = np\]

λ”°λΌμ„œ,

\[X_n \sim \text{Geo}\left( \frac{\lambda}{n} \right)\]

이제 $X$의 tail probability $P(X > x)$λ₯Ό μœ λ„ν•΄ λ΄…μ‹œλ‹€.

\[P(X > x) = P\left(\frac{X_n}{n} > x\right)\]

이것은 맨 μ²˜μŒμ— μ„Έμš΄ 비둀식에 μ˜ν•΄ μ„±λ¦½ν•©λ‹ˆλ‹€.

\[\begin{aligned} P(X > x) &= P\left(\frac{X_n}{n} > x\right) \\ &= P(X_n > nx) \\ &= \left( 1 - \frac{\lambda}{n}\right)^{nx} \\ &= e^{-\lambda x} \quad \text{as } n \rightarrow \infty \end{aligned}\]

Tail Probability $P(X > x)$μ—μ„œ CDF $P(X \le x)$λ₯Ό μœ λ„ν•˜λ©΄ μ•„λž˜μ™€ κ°™μŠ΅λ‹ˆλ‹€.

\[P(X \le x) = 1 - P(X > x) = 1 - e^{-\lambda x}\]

CDFλ₯Ό λ―ΈλΆ„ν•˜λ©΄ PDFλ₯Ό 얻을 수 μžˆμŠ΅λ‹ˆλ‹€.

\[f_X(x) = \lambda \cdot e^{-\lambda x}\]

즉, κΈ°ν•˜ λΆ„ν¬μ—μ„œ κ·Ήν•œμ„ μ·¨ν•˜λ©΄ μ§€μˆ˜ 뢄포가 μœ λ„λ©λ‹ˆλ‹€! πŸš€

맺음말

  • β€œμ§€μˆ˜ λΆ„ν¬β€λŠ” β€œκΈ°ν•˜ λΆ„ν¬β€μ˜ κ·Ήν•œ 버전 μž…λ‹ˆλ‹€. κΈ°ν•˜ λΆ„ν¬μ—μ„œ trial을 μ‹œν–‰ν•˜λŠ” μ‹œκ°„ 간격 $1/n$이 0에 κ°€κΉŒμ›Œμ§„λ‹€λ©΄, κΈ°ν•˜ λΆ„ν¬λŠ” μ§€μˆ˜ 뢄포λ₯Ό λ”°λ₯΄κ²Œ λ©λ‹ˆλ‹€.


λ³Έ ν¬μŠ€νŠΈλŠ” β€œμ§€μˆ˜ 뢄포(Exponential Distribution)β€œμ— λŒ€ν•œ 포슀트 λ‚΄μš©μ΄ κΈΈμ–΄μ Έμ„œ λ³„λ„λ‘œ λΆ„λ¦¬ν•œ λ¬Έμ„œ μž…λ‹ˆλ‹€. μ§€μˆ˜ 뢄포와 κ΄€λ ¨λœ 전체 λͺ©λ‘μ€ μ•„λž˜μ—μ„œ 확인할 수 μžˆμŠ΅λ‹ˆλ‹€!

References