Lotteries & Lottery Preference
μ‘Έμ μ μν΄ λ§μ§λ§ νκΈ°μ βλ―Έμκ²½μ νβ μμ μ λ£κ² λμμ΅λλ€. κ²½μ νμλ‘ μμ μ μ¬λ°κ² λ€μ΄μ κ²½μ μͺ½μ΄λ κΆν©μ΄ μ’μ μ€ μκ³ μ μ² νλλ°, μ¬κ±Έβ¦ μ΄ κ³Όλͺ©μ μ¬μ€μ μνκ³Ό κ³Όλͺ© μ΄μμ΅λλ€.. γ γ κ·Έλλ μνκ³Ό 볡μμ 곡λ νκ³ μμΌλ, μ΄ μμ λ νλ΄μ μ λ€μ΄λ΄ μλ€! μ 체 ν¬μ€νΈλ βλ―Έμκ²½μ νβ μΉ΄ν κ³ λ¦¬μμ νμΈνμ€ μ μμ΅λλ€.
Lotteries
μ§κΈκΉμ§ μ΄ν΄λ³Έ μ νΈ(Preference), ν¨μ© ν¨μ(Utility Functions), μ ν ν¨μ(Choice Functions) λͺ¨λ μ νκ³Ό κ²°κ³Όκ° κ³ μ μ μΌλ‘ μ ν΄μ§λ μν©μ΄μμ΅λλ€.
β볡κΆ(Lotteries)βλ νλ₯ μ μΈ κ²°κ³Όλ₯Ό ν¬ν¨νλ μν μ λλ€. μ νμ νλ©΄, 보μμ΄ νλ₯ μ μΌλ‘ κ²°μ λ©λλ€.
μ΄λ€ 보μμ μ§ν©μ $Z$λΌκ³ ν λ, Lottery $p$λ $z \in Z$μ νλ₯ $p(z)$λ₯Ό ν λΉ ν©λλ€.
λ‘ν°λ¦¬μμ νλ₯ μ΄ 0λ³΄λ€ ν° λ³΄μμ μ§ν©μ support $\text{supp}(p)$λΌκ³ ν©λλ€.
\[\text{supp}(p) = \left\{ z \in Z | p(x) > 0 \right\}\]- $L(Z)$
- set of all lotteries over $Z$
- $[z]$
- the lottery that yields the prize $z$ with probability 1
- Deterministic Lottery, Unity Lottery
κ·Έλ¦¬κ³ λ³΅κΆ βLotteryβμ λν νκΈ°λ μλμ κ°μ΄ ν μ μμ΅λλ€.
each $\alpha_k = p(z_k)$
\[p = \alpha_1 \cdot z_1 \oplus \cdots \oplus \alpha_n \cdot z_n\]Visualize set of lotteries
$Z$κ° λ κ°μ μν $z_1, z_2$λ‘ κ΅¬μ± λμ΄ μκ³ , κ° μνμ λν νλ₯ μ΄ $p_1, p_2$λΌκ³ ν©μλ€.
νλ₯ μ ν©μ νμ 1μ΄μ΄μΌ νκΈ° λλ¬Έμ $p_1 + p_2 = 1$μ λ§μ‘±νκ³ , μ΄λ μμ κ·Έλ¦Όμ²λΌ νλ©΄ μμ ννν μ μμ΅λλ€.
λ§μ½, $Z$κ° 3κ°μ μνμΌλ‘ κ΅¬μ± λμ΄ μμλ€λ©΄, λΉμ·νκ² 3μ°¨μμ κ³΅κ° λ€μ 그릴 μ μμ΅λλ€.
2μ°¨μμ μ§μ κ³Ό, 3μ°¨μμ λ©΄μ λͺ¨λ 2κ° μν, 3κ° μνμμ λ§λ€ μ μλ λͺ¨λ 볡κΆμ μ§ν©μ ννν κ² μ λλ€.
Preference over Lotteries
μ΄λ€ μ¬λ μμ μ¬λ¬ μ’ λ₯μ 볡κΆμ΄ μμ΅λλ€. μ¬λλ§λ€ μ νΈνλ 볡κΆμ΄ λ€λ₯Ό ν μ£ . μ¬λλ€μ΄ μ΄λ€ 볡κΆμ μ νΈ νλμ§μ λν΄ μκΈ°ν΄λ΄ λλ€.
Pessimist
λΉκ΄μ£Όμμμ μμ μ λλ€. μ΄ μ¬λμ 볡κΆμ νκ°ν λ, κ·Έ μμμ μΌμ΄λ μ μλ κ²°κ³Όλ€ μ€ βκ°μ₯ λμ κ²°κ³Όβλ₯Ό κΈ°μ€μΌλ‘ νλ¨ ν©λλ€.
κ·Έ λμ κ²°κ³Όκ° μ무리 μμ νλ₯ μ κ°λλΌλ, λΉκ΄μ£Όμμλ κ°μ₯ λμ κ²°κ³Όλ₯Ό κΈ°μ€μΌλ‘ κ·Έ 볡κΆμ νκ° ν©λλ€.
λΉκ΄μ£Όμμλ κ° λ³΅κΆμ κ°μ₯ λμ κ²°κ³Ό $w(p)$λ‘ λ체ν΄μ μκ° ν©λλ€. κ·Έλ¦¬κ³ , κ·Έ λμ κ²°κ³Ό μ€μμ κ°μ₯ ν° ν¨μ©μ κ°μ§λ 볡κΆμ μ νΈ ν©λλ€.
Good and Bad
μ΄ μ¬λμ 볡κΆμ μ’μκ²(good)κ³Ό λμκ²(bad) λ μ§λ¨μΌλ‘ λΆν νμ¬ μκ° ν©λλ€.
κ·Έλ¦¬κ³ , μ’μκ²μ νλ₯ λͺ¨λ λν΄ $G(p)$λ‘ λ‘λλ€.
\[G(p) = \sum_{z\in\text{good}} p(z)\]μ΄ μ¬λμ κ° λ³΅κΆμμ νλ₯ $G(p)$λ₯Ό ꡬνκ³ , μ΄κ²μ΄ λμ 볡κΆμ μ νΈ ν©λλ€.
μ΄ μ¬λμ μ’μ κ²°κ³Όμ κ°μΉλ 무μνκ³ , μ’μ κ²°κ³Όκ° λμ¬ νλ₯ λ§μ κΈ°μ€μΌλ‘ μ ν ν©λλ€.
Minimizing Options
μ΄ μ¬λμ μΌμ΄λ μ μλ κ²½μ°μ μκ° μμ κ±Έ μ νΈ ν©λλ€. μ΄μ λ₯Ό λ€μ΄λ³΄λ, κ°λ₯ν κ²½μ°μ μκ° μ μμλ‘ λλΉνκΈ° μ½κ³ μμ¬ λλ€κ³ νλ€μ. μ¦, λΆνμ€μ±μ΄ μ μμλ‘ μ νΈνλ μ¬λ μ λλ€.
\[p > q \iff \| \text{supp}(p) \| \ge \| \text{supp}(p) \|\]μ΄λ° κ²½μ°λ μ΄λ€ μν©μ μ€λΉνλκ² μ€μν μν©, μλ₯Ό λ€λ©΄ μλ£ μμ μ΄λ κ΅°μ¬ μμ μμ μ΄ μ νΈκ° μ μ©ν μ μμ΅λλ€.
Summary
μμμ 볡κΆμ λν 3κ°μ§μ μ νΈ λ°©μμ μ΄ν΄λ³΄μμ΅λλ€β¦λ§ 볡κΆμ λν μ νΈλ μ λ§ λ€μνκ² μ μν μ μμ΅λλ€.
μμΌλ‘λ μ΄λ° λ³΅κΆ μ νΈλ€ μ€μμ βμ’μ μ±μ§βμ λ§μ‘±νλ νΉλ³ν λ³΅κΆ μ νΈλ€λ§ 골λΌμ μ’λ μ΄ν΄λ³΄κ³ μ ν©λλ€.
Properties
βλ³΅κΆ μ νΈβμμ μ μν μ μλ μ¬λ¬ μ±μ§λ€μ λν΄ μ΄ν΄λ΄ λλ€.
Continuity
μνκΆ 100λ§μ, 70λ§μ, 40λ§μμ΄ μμ΅λλ€. λ§μ½ 100λ§μμ΄ 0.5 νλ₯ , 40λ§μμ΄ 0.5 νλ₯ μΈ λ³΅κΆμ΄ μλ€λ©΄, κ·Έ μ¬λμ 70λ§μκ³Ό κ·Έ 볡κΆμ 무차λ³νκ² μ νΈ νλ€κ³ ν©λλ€.
μμ κ°μ μν©μ΄ 볡κΆμ λν μ νΈκ° Continuityλ₯Ό λ§μ‘±νλ€κ³ ν©λλ€. νμμ κ°μΆ°μ μ μ΄λ³΄λ©΄,
볡κΆμ λν 보μ $Z$μ λν΄ μλμ κ°μ΄ μ°μμ μΈ μ νΈκ° μμ΅λλ€.
\[[a] \succ [b] \succ [c]\]κ·Έλ¦¬κ³ , $b$μ λλ±ν κ°μΉλ‘ μ¬κ²¨μ§λ μ΄λ€ 볡κΆμ λ§λ€μ΄λΌ μ μλ€λ©΄,
\[[b] \sim \alpha \cdot a \oplus (1-\alpha) \cdot c\]βμ νΈ κ΄κ³κ° 볡κΆμ λν΄ μ°μμ±μ κ°λλ€βκ³ λ§ν©λλ€.
λΉκ΄μ£Όμμκ° κ°λ μ νΈλ μ°μμ±μ κ°μ§ λͺ»ν©λλ€. μλνλ©΄, λΉκ΄μ£Όμμλ $a$μ $c$λ₯Ό μμ 볡κΆμ΄ μμΌλ©΄ νμ μ μ’μ μ νμ§ $c$λ₯Ό κΈ°μ€μΌλ‘ νλ¨νκΈ° λλ¬Έμ λλ€.
βGood and Badβ μ νΈλ vacuously μ°μμ΄λΌκ³ ν©λλ€. κ·Έ μ΄μ λ μ’μ κ²°κ³Όκ° λμ¬ νλ₯ μ μ΄ν© $G(p)$λ§ λ³΄κ³ νλ¨νκΈ° λλ¬Έμ 보μμ λν μ‘°ν©μ΄ μλ―Έκ° μκΈ° λλ¬Έμ λλ€. μ΄ μ νΈμμλ μ°μμ±μ ν μ€νΈν μν© μμ²΄κ° μλ€κ³ ν©λλ€.
βMinimizing Optionsβλ vacuously μ°μμ΄λΌκ³ ν©λλ€. μλνλ©΄, $[a] \succ [b] \succ [c]$μ κ°μ 보μ κ°μ μ νΈκ° μμ μ μλμ§ μκΈ° λλ¬Έμ λλ€. κ·Έλμ μ μ΄μ μ°μμ±μ λν μ μ¬κ° μ±λ¦½νμ§ μκ³ , μ°μμ±μ΄ vacuously λ§μ‘±νλ€κ³ λ΄ λλ€.
* βvacuously μ°μνλ€βλ κ²μ 곡ννκ² μ°μμ΄λΌκ³ νννλλ°, 쑰건μ λ§μ‘±ν΄μΌ ν μν© μμ²΄κ° μμ μ‘΄μ¬νμ§ μκΈ° λλ¬Έμ 쑰건μ μλμΌλ‘ λ§μ‘±νλ€λ κ²μ λ§ν©λλ€.
Compound Lottery
λ³΅ν© λ³΅κΆ, λ³΅κΆ μμ 볡κΆ. λ λ¨κ³ μ΄μμ 무μμμ±μ΄ μμ λλ₯Ό λͺ¨λΈλ§ νλ λ°©λ² μ λλ€.
보μμ λν μ§ν© $Z$κ° μκ³ , κ·Έ μμ μ μλ λ³΅κΆ $p_1, β¦, p_k$κ° μμ΅λλ€. μ΄λ€μ $L(Z)$μ μμ μ λλ€.
λ³΅ν© λ³΅κΆμ μλμ κ°μ΄ μ μ λ©λλ€.
\[\alpha_1 p_1 \oplus \alpha_2 p_2 \oplus \cdots \oplus \alpha_k p_k\]μ΄κ²μ κ° μ¬ν $z \in Z$μ λν νλ₯ μ νμ΄μ°λ©΄ μ΄λ κ² λ©λλ€.
\[\text{Prob}(z) = \sum_{i=1}^{k} \alpha_k \cdot p_k(z)\]Independence
볡κΆμμ νΉμ νλͺ©μ λ μ νΈλλ λ€λ₯Έ κ±Έ(μν or 볡κΆ)λ‘ λ°κΎΌλ€λ©΄, μ΄μ 볡κΆκ³Ό μ κ· λ³΅κΆ μ¬μ΄μ λ³΅κΆ μ νΈλ λ체ν μν μ¬μ΄μ μ νΈ κ΄κ³λ₯Ό κ·Έλλ‘ λ°λ₯Έλ€. μ¦, λ체λ μνλ§ λ³΄λ©΄ λκ³ , λ체λμ§ μμ λ€λ₯Έ μνλ€μ μ κ²½ μ°μ§ μμλ λλ. κ° μνλ€μ μλ‘ μν₯μ μ£Όμ§ μλ βλ 립μ±βμ κ°λλ€.
μμμΌλ‘ μ΄ν΄νλκ² μ’λ νΈν©λλ€.
λ βμνβ μ¬μ΄μ μλμ κ°μ μ νΈκ° μ±λ¦½ ν©λλ€.
\[[a] \succcurlyeq [z_k]\]λ³΅κΆ μ νΈκ° λ 립μ±μ κ°λλ€λ©΄, μ κ· λ³΅κΆκ³Ό κΈ°μ‘΄ 볡κΆμ λ체λ μνμ΄ κ°λ μ νΈλ₯Ό κ·Έλλ‘ λ°λ¦ λλ€.
\[\begin{gather*} \cdots \oplus \alpha_k \cdot {\color{red} a} \oplus \cdots \\ \succcurlyeq \\ \cdots \oplus \alpha_k \cdot {\color{red} z_k} \oplus \cdots \end{gather*}\]κ·Έλ¦¬κ³ μ΄ λͺ μ μ λν μλ μ±λ¦½ ν©λλ€.
λ β볡κΆβ μ¬μ΄μ μλμ κ°μ μ νΈκ° μ±λ¦½ ν©λλ€.
\[\beta \cdot a \oplus (1-\beta) \cdot b \succcurlyeq [z_k]\]λ³΅κΆ μ νΈκ° λ 립μ±μ κ°λλ€λ©΄, μ κ· λ³΅κΆκ³Ό κΈ°μ‘΄ 볡κΆμ λ체λ 볡κΆμ΄ κ°λ μ νΈλ₯Ό κ·Έλλ‘ λ°λ¦ λλ€.
\[\begin{gather*} \cdots \oplus \alpha_k \cdot {\color{red} (\beta \cdot a \oplus (1-\beta) \cdot b)} \oplus \cdots \\ \succcurlyeq \\ \cdots \oplus \alpha_k \cdot {\color{red} z_k} \oplus \cdots \end{gather*}\]κ·Έλ¦¬κ³ μ΄ λͺ μ μ λν μλ μ±λ¦½ ν©λλ€.
Monotonicity
βλ¨μ‘°μ±βμ μνμ μ νΈ μ²΄κ³μ 볡κΆμ λν μ νΈ μ²΄κ³κ° μΌκ΄μ± μλλ‘ νλ μ±μ§ μ λλ€.
λ μν $a$, $b$κ° μμ λ, λ μν μ¬μ΄μλ $a \succ b$μ μ νΈκ° μ‘΄μ¬ν©λλ€. λ μνμΌλ‘ λ§λ€ μ μλ λ³΅κΆ μ§ν© $L(Z)$μ λν΄μ μ¬λλ€μ 볡κΆμ λν μ νΈλ $a$ μνμ΄ λΉμ²¨λ νλ₯ $\alpha$κ° λμμλ‘ μ νΈ λ©λλ€.
ν©λ¦¬μ μΈ μ νμ νκΈ° μν΄μ , λ μ νΈλλ μνμΈ $a$κ° λμ¬ νλ₯ μ΄ λμμ§ μλ‘ κ·Έ 볡κΆμ λ μ νΈν΄μΌ ν©λλ€. λ§μ½ κ·Έκ±Έ μ’μνμ§ μλλ€λ©΄ λΉν©λ¦¬μ μΈ μ νμ νλ€λ κ²μ΄μ£ . 볡κΆμ βλ¨μ‘°μ±βμ μ νΈ μ²΄κ³κ° μΌκ΄μ± μκ² κ΅¬μ±λλ μ¦κ±°λ‘ μ¬μ© ν©λλ€.
Independence implies Monotonicity
Let $Z$ be a set of prizes.
Assume that $\succcurlyeq$, a preference relation over $L(Z)$, satisfies the independence property.
Let $a$ and $b$ be two prizes with $[a] \succ [b]$, and let $\alpha$ and $\beta$ be two probabilities. Then
\[\begin{gather*} \alpha > \beta \\ \iff \\ {\color{red} \alpha} \cdot a \oplus (1 - \alpha) \cdot b \succ {\color{red} \beta} \cdot a \oplus (1 - \beta) \cdot b \end{gather*}\]λ³΅κΆ $p_{\alpha}$λ₯Ό
\[p_{\alpha} = \alpha \cdot a \oplus (1 - \alpha) \cdot b\]λΌκ³ ν©μλ€. 볡κΆμ λν μ νΈ κ΄κ³κ° λ 립μ±μ λ§μ‘±νλ―λ‘, λ³΅κΆ $p_{\alpha}$μμ $a$λ₯Ό $b$λ‘ λ체ν 볡κΆμ λν΄ μλμ μ νΈκ° μ±λ¦½ ν©λλ€.
\[p_{\alpha} \succ \alpha \cdot b \oplus (1 - \alpha) \cdot b\]μμ μ νΈ κ΄κ³λ μ¬μ€ μλμ κ°μ΅λλ€.
\[p_{\alpha} \succ [b]\]μ¬κΈ°μμ μ κΉ $p_{\alpha}$λ₯Ό μλμ κ°μ΄ λ°κΏμ νν ν©λλ€.
\[p_{\alpha} = (\beta/\alpha) \cdot p_{\alpha} \oplus (1 - \beta/\alpha) \cdot p_{\alpha}\]μμ ννμ κΉκ² μκ°ν 건 μκ³ , λ¨μν $p_{\alpha}$λ₯Ό $\beta / \alpha$μ νλ₯ λ‘ λΆν ν κ² μ λλ€. μΌμ’ μ μμ μ κ°μ νΈλ¦μ΄λΌκ³ μκ°ν©μλ€!
λ€μ μ νΈμ λ 립μ±μ μ¬μ©ν΄ μ΄λ° μ νΈ κ΄κ³λ₯Ό μ»μ μ μμ΅λλ€.
\[\begin{aligned} p_{\alpha} &= (\beta/\alpha) \cdot p_{\alpha} \oplus (1 - \beta/\alpha) \cdot {\color{red} p_{\alpha}} \\ &\succ (\beta/\alpha) \cdot p_{\alpha} \oplus (1 - \beta/\alpha) \cdot {\color{red} b} \end{aligned}\]μ΄μ λ§μ§λ§μ μ»μ 볡κΆμ λν μμ μ μ 리νλ©΄
\[\begin{aligned} &(\beta/\alpha) \cdot p_{\alpha} \oplus (1 - \beta/\alpha) \cdot b \\ &= \beta \cdot a \oplus (1 - \beta) \cdot b \end{aligned}\]λ°λΌμ,
\[{\color{red} \alpha} \cdot a \oplus (1 - \alpha) \cdot b \succ {\color{red} \beta} \cdot a \oplus (1 - \beta) \cdot b\]$\blacksquare$
λ§Ίμλ§
μ΄μ΄μ§λ ν¬μ€νΈμμλ βκΈ°λ ν¨μ©(Expected Utility)βμ λν΄ μ΄ν΄λ΄ λλ€.
κ²½μ νμ μ νμ ν λ, λ§μ κ²λ€μ΄ λΆνμ€μ±μ κ°μ§κ³ μμ΅λλ€. μ΄λ²μ μ΄ν΄λ³Έ 볡κΆ(Lotteries)λ μ΄ λΆνμ€μ λͺ¨λΈλ§ν κ² μ λλ€. κΈ°λ ν¨μ©μ λΆνμ€ν¨μ΄ μμ λ, μ¬λλ€μ μ νμ κΈ°μ€μ΄ λ©λλ€. κ·Έλ¦¬κ³ μ¬λλ€μ΄ κΈ°λ ν¨μ©μ λ°λΌ νλνλ€λ κ²μ μ μ λ‘ κ²½μ ν μ΄λ‘ μ΄ λ°μ νκ² λ©λλ€.