“Machine Learning”을 공부하면서 개인적인 용도로 정리한 포스트입니다. 지적은 언제나 환영입니다 :)

5 minute read

“Machine Learning”을 공부하면서 개인적인 용도로 정리한 포스트입니다. 지적은 언제나 환영입니다 :)


이번 포스트는 “확률론(Probability Theory)”과 “Machine Learning”에서 등장하는 “Process” 가 붙은 모든 개념을 넓은 시야로 살펴보기 위해 작성한 포스트입니다. 다루는 주제는 아래와 같습니다.


Introduction to Random Process

Definition. Random Process

A random process is a time-varying function, that assigns the outcome of a random experiment to each time instant.

대충, (time instant)에 random experiment의 결과(outcome)을 매핑한다는 뜻이다.

또는 아래와 같이 정의하기도 하는데,

A (infinite) sequence of random variables $X_1, X_2, \dots, X_n, \dots$

즉, RV의 infinite sequence를 <random process>라고 한다. 첫번째 정의보다는 두번째 정의가 좀더 와닿는 편이다. 👍

<random process>를 정의할 때, RV $X_i$가 등장했으니 자연스럽게 아래의 성질들을 가질 것이다.

  • $E[X_i]$: mean of RV
  • $\text{Var}(X_i)$: variance of RV
  • $p_{X_i} (x_i)$: marginal probability distribution of RV

우리는 <random process> 자체의 분포를 생각해볼 수도 있는데, 이것은 아래와 같은 joint probability distribution이 된다.

\[p_{X_1, \dots, X_n, \dots} (x_1, \dots, x_n, \dots)\]

또, 우리는 <random process>의 Sample Space $\Omega$에 대해 생각해볼 수 있다.

<random process> 중 하나인 <Bernoulli Process>의 경우, Sample Sapce는 0-1의 infinite sequence가 된다.

Property. Sample Space of Bernoulli Process

\[\Omega_{\text{BP}} = \left\{ (b_1, \dots, b_n, \dots ) \mid b_i \in \{ 0, 1 \} \right\}\]

Some Properties of Random Process

<Random Process>는 아래와 같은 몇가지 특징을 가질 수 있다. 이것은 필수적인 것은 아니며, 몇몇 <random process>에 공통적으로 보이는 특징이거나 가정이다.

1. Independence btw trials

개별 trials은 서로 독립적으로 이루어진다. 즉, 영향을 주지 않는다.

  • Bernoulli Process, Poisson Process, …

2. Memoeryless Property

\[P(X = x + k \mid x > k) = P(X = x)\]
  • Bernoulli Process, Poisson Process, …
  • Markov Process

Bernoulli Process (2)

이번 문단에서는 <Bernoulli Process>에 대한 내용에서 추가적인 주제들을 다룬다. 아직 <Bernoulli Process>가 뭔지 모른다면, 위의 포스트를 먼저 읽어보자!

<Bernoulii Process>에서 어떤 random variable $Y$를 조건과 함께 정의하면 새로운 확률 분포를 유도할 수 있다! 우리는 <Binomial distribution>, <Geometric distribution>, <Negative BIN distribution>을 <Bernoulli Process>로부터 유도해보겠다 😁

1. Number of Success $S_n$ in $n$ trials.

Let’s derive a random variable $S_n = X_1 + \cdots + X_n$ from the Bernoulli Process.

Then, $S_n$ follows the <Binomial Distribution>!

\[P(S_n = x) = \binom{n}{x} p^x (1-p)^{n-x} \quad \text{for} \; x=0, 1, \dots, n\]

2. Time until the first success

Let’s derive a randome variable $T_1 = \min \{ i \in \mathbb{N} : X_i = 1\}$ from the Bernoulli Process.

Then, $T_1$ follows the <Geometric Distribution>!

\[P(T_1 = x) = P(\underbrace{0, 0, \dots, 0}_{x-1}, 1) = (1-p)^{x-1} p \quad \text{for} \; x=1, 2, \dots\]

3. Time until the first $k$ success

<Geometric Random Variable>인 $T_1$을 확장한 개념이다.

Let’s derive a randome variable $T_k = \min \{ i \in \mathbb{N} : | \{ X_i : X_i = 1 \} | = k\}$ from the Bernoulli Process.

Then, $T_n$ follows the <Negative Binomial Distribution>!

\[P(T_k = x) = P(\underbrace{0, 1, \dots, 1, \dots, 0}_{k-1 \text{ success}}, 1) = \binom{x-1}{k-1} (1-p)^{x-k} p^k \quad \text{for} \; x=k, k+1, \dots\]

Poisson Process

<Poisson Process>는 <Bernoulli Process>에서 극한을 취해 time interval의 간격을 아주아주 줄여서 continuous domain 위에서 정의한 Random Process이다. BP가 $\mathbb{N}$ 위에서 정의되었다면, PP는 $\mathbb{R^{+}}$ 위에서 정의되는 Random Process인 셈!

PP에 대한 내용은 아래 포스트의 내용으로 대체한다 🙏

👉 Poisson Process


Gaussian Process

A sequence of Gaussian distribution으로, multi-variate Gaussian distribution의 일반화된 버전이다. “distribution over functions”으로 취급한다! 💪

👉 Distribution over functions & Gaussian Process


Markov Process

👉 Markov Process


references