Lotteries

7 minute read

Lotteries

ν™•λ₯ μ μΈ κ²°κ³Όλ₯Ό ν¬ν•¨ν•˜λŠ” 선택지 μž…λ‹ˆλ‹€. μ‚¬λžŒμ΄ 선택을 ν•˜λ©΄, 보상이 ν™•λ₯ μ μœΌλ‘œ κ²°μ • λ©λ‹ˆλ‹€.

μ–΄λ–€ λ³΄μƒμ˜ 집합을 $Z$라고 ν•  λ•Œ,

Lottery $p$λŠ” $z \in Z$에 ν™•λ₯  $p(z)$λ₯Ό ν• λ‹Ή ν•©λ‹ˆλ‹€.

λ‘œν„°λ¦¬μ—μ„œ ν™•λ₯ μ΄ 0보닀 큰 λ³΄μƒμ˜ 집합을 support $\text{supp}(p)$라고 ν•©λ‹ˆλ‹€.

\[\text{supp}(p) = \left\{ z \in Z | p(x) > 0 \right\}\]
  • $L(Z)$
    • set of all lotteries over $Z$
  • $[z]$
    • the lottery that yields the prize $z$ with probability 1
    • Deterministic Lottery, Unity Lottery

그리고 Lottery에 λŒ€ν•œ ν‘œκΈ°λŠ” μ•„λž˜μ™€ 같이 ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

each $\alpha_k = p(z_k)$

\[\alpha_1 \cdot z_1 \oplus \cdots \oplus \alpha_n \cdot z_n\]

Visualize set of lotteries

λ§Œμ•½ $Z$κ°€ 두 개의 μƒν’ˆ $z_1, z_2$둜 ꡬ성 λ˜μ–΄ μžˆλ‹€κ³  ν•œλ‹€κ³ , 각 μƒν’ˆμ— λŒ€ν•œ ν™•λ₯  $p_1, p_2$κ°€ ν• λ‹Ή λœλ‹€κ³  ν•˜μž.

ν™•λ₯ μ˜ 합은 항상 1이어야 ν•˜κΈ° λ•Œλ¬Έμ— $p_1 + p_2 = 1$을 λ§Œμ‘±ν•˜κ³ , μ΄λŠ” μœ„μ˜ 그림처럼 평면 μœ„μ— ν‘œν˜„ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

λ§Œμ•½, $Z$κ°€ 3개의 μƒν’ˆμœΌλ‘œ ꡬ성 λ˜μ–΄ μžˆμ—ˆλ‹€λ©΄, λΉ„μŠ·ν•˜κ²Œ 3μ°¨μ›μ˜ 곡간 뒀에 그릴 수 μžˆμŠ΅λ‹ˆλ‹€.

Preference over lotteries

μ–΄λ–€ μ‚¬λžŒ μ•žμ— μ—¬λŸ¬ μ’…λ₯˜μ˜ 볡ꢌ이 μžˆμŠ΅λ‹ˆλ‹€. μ‚¬λžŒλ§ˆλ‹€ μ„ ν˜Έν•˜λŠ” 볡ꢌ이 λ‹€λ₯Ό ν…Œμ£ . μ•„λž˜μ—μ„œλŠ” μ‚¬λžŒλ“€μ˜ λ³΅κΆŒμ— λŒ€ν•œ μ„ ν˜Έμ— λŒ€ν•΄ μ–˜κΈ°ν•΄λ΄…λ‹ˆλ‹€.

Pessimist

λΉ„κ΄€μ£Όμ˜μžμ˜ μ˜ˆμ‹œ μž…λ‹ˆλ‹€. 이 μ‚¬λžŒμ€ λ³΅κΆŒμ„ 평가할 λ•Œ, κ·Έ μ•ˆμ—μ„œ 일어날 수 μžˆλŠ” κ²°κ³Όλ“€ 쀑 β€œκ°€μž₯ λ‚˜μœ 결과”λ₯Ό κΈ°μ€€μœΌλ‘œ νŒλ‹¨ ν•©λ‹ˆλ‹€.

κ·Έ λ‚˜μœ κ²°κ³Όκ°€ 아무리 μž‘μ€ ν™•λ₯ μ„ 갖더라도, λΉ„κ΄€μ£Όμ˜μžλŠ” κ°€μž₯ λ‚˜μœ κ²°κ³Όλ₯Ό κΈ°μ€€μœΌλ‘œ κ·Έ λ³΅κΆŒμ„ 평가 ν•©λ‹ˆλ‹€.

λΉ„κ΄€μ£Όμ˜μžλŠ” 각 λ³΅κΆŒμ„ κ°€μž₯ λ‚˜μœ κ²°κ³Ό $w(p)$둜 λŒ€μ²΄ν•΄μ„œ 생각 ν•©λ‹ˆλ‹€. 그리고, κ·Έ λ‚˜μœ κ²°κ³Ό μ€‘μ—μ„œ κ°€μž₯ 큰 νš¨μš©μ„ κ°€μ§€λŠ” λ³΅κΆŒμ„ μ„ ν˜Έ ν•©λ‹ˆλ‹€.

Good and Bad

이 μ‚¬λžŒμ€ λ³΅κΆŒμ€ 쒋은것(good)κ³Ό λ‚˜μœκ²ƒ(bad) 두 μ§‘λ‹¨μœΌλ‘œ λΆ„ν•  ν•˜μ—¬ 생각 ν•©λ‹ˆλ‹€.

그리고, μ’‹μ€κ²ƒμ˜ μ§‘λ‹¨μ˜ ν™•λ₯  λͺ¨λ‘ 계산해 $G(p)$둜 λ‘‘λ‹ˆλ‹€.

\[G(p) = \sum_{z\in\text{good}} p(z)\]

이 μ‚¬λžŒμ€ 각 λ³΅κΆŒμ— λŒ€ν•œ 쒋은 κ±Έ 얻을 ν™•λ₯  $G(p)$λ₯Ό κ΅¬ν•˜κ³ , 이것이 높은 λ³΅κΆŒμ„ μ„ ν˜Έ ν•©λ‹ˆλ‹€.


이 μ‚¬λžŒμ€ 쒋은 결과의 κ°€μΉ˜λŠ” λ¬΄μ‹œν•˜κ³ , 쒋은 κ²°κ³Όκ°€ λ‚˜μ˜¬ ν™•λ₯ λ§Œμ„ κΈ°μ€€μœΌλ‘œ ν•©λ‹ˆλ‹€.

Minimizing Options

이 μ‚¬λžŒμ€ 일어날 수 μžˆλŠ” 경우의 μˆ˜κ°€ μž‘μ€ κ±Έ μ„ ν˜Έ ν•˜λŠ” μ‚¬λžŒ μž…λ‹ˆλ‹€. 이유λ₯Ό λ“€μ–΄λ³΄λ‹ˆ, κ°€λŠ₯ν•œ 경우의 μˆ˜κ°€ μ μ„μˆ˜λ‘ λŒ€λΉ„ν•˜κΈ° 쉽고 μ•ˆμ‹¬ λœλ‹€κ³  ν•˜λ„€μš”. 즉, λΆˆν™•μ‹€μ„±μ΄ μ μ„μˆ˜λ‘ μ„ ν˜Έν•˜λŠ” μ‚¬λžŒ μž…λ‹ˆλ‹€.

\[p > q \iff \| \text{supp}(p) \| \ge \| \text{supp}(p) \|\]

이런 κ²½μš°λŠ” μ–΄λ–€ 상황을 μ€€λΉ„ν•˜λŠ”κ²Œ μ€‘μš”ν•œ 상황, 예λ₯Ό λ“€λ©΄ 의료 μˆ˜μˆ μ΄λ‚˜ ꡰ사 μž‘μ „μ—μ„  이 μ„ ν˜Έκ°€ μœ μš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

Summary

μœ„μ—μ„œ λ³΅κΆŒμ— λŒ€ν•œ 3κ°€μ§€μ˜ μ„ ν˜Έ 방식을 μ‚΄νŽ΄λ³΄μ•˜μŠ΅λ‹ˆλ‹€β€¦λ§Œ λ³΅κΆŒμ— λŒ€ν•œ μ„ ν˜ΈλŠ” 정말 λ‹€μ–‘ν•˜κ²Œ μ •μ˜ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

μ•žμœΌλ‘œλŠ” 이런 볡ꢌ μ„ ν˜Έλ“€ μ€‘μ—μ„œ β€œμ’‹μ€ μ„±μ§ˆβ€μ„ λ§Œμ‘±ν•˜λŠ” νŠΉλ³„ν•œ 볡ꢌ μ„ ν˜Έλ“€λ§Œ κ³¨λΌμ„œ 쒀더 μ‚΄νŽ΄λ³΄κ³ μž ν•©λ‹ˆλ‹€.

Properties

Continuity

μƒν’ˆκΆŒ 100λ§Œμ›, 70λ§Œμ›, 40λ§Œμ›μ΄ μžˆμŠ΅λ‹ˆλ‹€. λ§Œμ•½ 100λ§Œμ›μ΄ 0.5 ν™•λ₯ , 40λ§Œμ›μ΄ 0.5 ν™•λ₯ μΈ 볡ꢌ이 μžˆλ‹€λ©΄, κ·Έ μ‚¬λžŒμ€ 70λ§Œμ›κ³Ό κ·Έ λ³΅κΆŒμ„ λ¬΄μ°¨λ³„ν•˜κ²Œ μ„ ν˜Έ ν•œλ‹€κ³  ν•©λ‹ˆλ‹€.

μœ„μ™€ 같은 상황이 λ³΅κΆŒμ— λŒ€ν•œ μ„ ν˜Έκ°€ Continuityλ₯Ό λ§Œμ‘±ν•œλ‹€κ³  ν•©λ‹ˆλ‹€. ν˜•μ‹μ„ κ°–μΆ°μ„œ 적어보면,

λ³΅κΆŒμ— λŒ€ν•œ 보상 $Z$에 λŒ€ν•΄ μ•„λž˜μ™€ 같이 연속적인 μ„ ν˜Έκ°€ μžˆμŠ΅λ‹ˆλ‹€.

\[[a] \succ [b] \succ [c]\]

그리고, $b$와 λ™λ“±ν•œ κ°€μΉ˜λ‘œ μ—¬κ²¨μ§€λŠ” μ–΄λ–€ λ³΅κΆŒμ„ λ§Œλ“€μ–΄λ‚Ό 수 μžˆλ‹€λ©΄,

\[[b] \sim \alpha \cdot a \oplus (1-\alpha) \cdot c\]

β€œμ„ ν˜Έ 관계가 λ³΅κΆŒμ— λŒ€ν•΄ 연속성을 κ°–λŠ”λ‹€β€κ³  말할 수 μžˆμŠ΅λ‹ˆλ‹€.

λΉ„κ΄€μ£Όμ˜μžκ°€ κ°–λŠ” μ„ ν˜ΈλŠ” 연속성을 갖지 λͺ»ν•©λ‹ˆλ‹€. μ™œλƒν•˜λ©΄, λΉ„κ΄€μ£Όμ˜μžλŠ” $a$와 $c$λ₯Ό μ„žμ€ 볡ꢌ이 있으면 항상 $c$λ₯Ό κΈ°μ€€μœΌλ‘œ νŒλ‹¨ν•˜κΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€.

β€œGood and Bad” μ„ ν˜ΈλŠ” vacuously 연속이라고 ν•©λ‹ˆλ‹€. κ·Έ μ΄μœ λŠ” 쒋은 κ²°κ³Όκ°€ λ‚˜μ˜¬ ν™•λ₯ μ˜ 총합 $G(p)$만 보고 νŒλ‹¨ν•˜κΈ° λ•Œλ¬Έμ— 보상에 λŒ€ν•œ 쑰합이 μ˜λ―Έκ°€ μ—†κΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€. 이 μ„ ν˜Έμ—μ„œλŠ” 연속성을 ν…ŒμŠ€νŠΈν•  상황 μžμ²΄κ°€ μ—†λ‹€κ³  ν•©λ‹ˆλ‹€.

β€œMinimizing Options”도 vacuously 연속이라고 ν•©λ‹ˆλ‹€. μ™œλƒν•˜λ©΄, $[a] \succ [b] \succ [c]$와 같은 보상 κ°„μ˜ μ„ ν˜Έκ°€ μ•„μ˜ˆ μ •μ˜λ˜μ§€ μ•ŠκΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€. κ·Έλž˜μ„œ μ• μ΄ˆμ— 연속성에 λŒ€ν•œ μ „μž¬κ°€ μ„±λ¦½ν•˜μ§€ μ•Šκ³ , 연속성이 vacuously λ§Œμ‘±ν•œλ‹€κ³  λ΄…λ‹ˆλ‹€.

Compound Lottery

볡합 볡ꢌ, 볡ꢌ μ•ˆμ˜ 볡ꢌ. 두 단계 μ΄μƒμ˜ λ¬΄μž‘μœ„μ„±μ΄ μžˆμ„ λ•Œλ₯Ό λͺ¨λΈλ§ ν•˜λŠ” 방법 μž…λ‹ˆλ‹€.

보상에 λŒ€ν•œ 집합 $Z$κ°€ 있고, κ·Έ μœ„μ— μ •μ˜λœ 볡ꢌ $p_1, …, p_k$κ°€ μžˆμŠ΅λ‹ˆλ‹€. 이듀은 $L(Z)$의 μ›μ†Œ μž…λ‹ˆλ‹€.

볡합 λ³΅κΆŒμ€ μ•„λž˜μ™€ 같이 μ •μ˜ λ©λ‹ˆλ‹€.

\[\alpha_1 p_1 \oplus \alpha_2 p_2 \oplus \cdots \oplus \alpha_k p_k\]

이것을 각 μž¬ν™” $z \in Z$에 λŒ€ν•œ ν™•λ₯ μ„ ν’€μ–΄μ“°λ©΄ μ΄λ ‡κ²Œ λ©λ‹ˆλ‹€.

\[\text{Prob}(z) = \sum_{i=1}^{k} \alpha_k \cdot p_k(z)\]

Independence

볡ꢌ의 뢀뢄에 λŒ€ν•œ 일관성이 볡ꢌ 전체에 λŒ€ν•œ 일관성과 μΌμΉ˜ν•΄μ•Ό ν•œλ‹€λŠ” μ„±μ§ˆ μž…λ‹ˆλ‹€.

볡ꢌ λ‚΄μ˜ νŠΉμ • ν•­λͺ©μ„ λ‹€λ₯Έ 걸둜 바꿨을 λ•Œ, 볡ꢌ 전체에 λŒ€ν•œ μ„ ν˜Έλ„ 그에 맞게 μΌκ΄€λ˜κ²Œ λ°”λ€Œμ–΄μ•Ό ν•œλ‹€λŠ” μ„±μ§ˆ μž…λ‹ˆλ‹€.

μˆ˜μ‹μœΌλ‘œ μ΄ν•΄ν•˜λŠ”κ²Œ 쒀더 νŽΈν•©λ‹ˆλ‹€.

두 볡ꢌ 상이에 μ•„λž˜μ™€ 같은 μ„ ν˜Έκ°€ 성립 ν•©λ‹ˆλ‹€.

\[[z_k] \succeq \beta a \oplus (1-\beta) b\]

그러면, μ•„λž˜μ˜ μ„ ν˜Έλ„ 성립 ν•œλ‹€λ©΄, κ·Έ μ„ ν˜Έκ°€ λ³΅κΆŒμ— λŒ€ν•΄ 독립성을 κ°–μŠ΅λ‹ˆλ‹€.

\[\alpha_1 z_1 \oplus \cdots \oplus \alpha_k z_k \oplus \cdots \oplus a_n z_n \succeq \alpha_1 z_1 \oplus \cdots \oplus \alpha_k (\beta a \oplus (1-\beta) b) \oplus \cdots \oplus a_n z_n\]

그리고 이 λͺ…μ œμ— λŒ€ν•œ 역도 성립 ν•©λ‹ˆλ‹€.