Multiple Random Variables
์ง๊ธ๊น์ง๋ ํ๋์ ํน์ ํ ํ๋ฅ ๋ณ์(RV)์ ๋ํ ํ๋ฅ ์ด ์ผ๋ง๊ฐ ๋๋์ง๋ง ๊ตฌํด๋ณด์์ต๋๋ค.
๋ํ pdf(Probability Density Function)์์๋ X๋ผ๋ RV์ ๊ฐ์ด ํน์ ํจ ๋ฒ์ ์์ ๋ค์ด์์ ํ๋ฅ ์ ๊ตฌํ์์ต๋๋ค.
๊ทธ๋ฌ๋ ์ด๋ฒ์๋ ํ๋ฅ ๋ณ์๊ฐ 2๊ฐ์ธ ๊ฒฝ์ฐ์ ๋ํด์์ ํ๋ฅ ์ ๋ํด์ ์์๋ณด๊ฒ ์ต๋๋ค.
Joint distribution (๊ฒฐํฉ๋ถํฌ)
2๊ฐ ์ด์์ ํ๋ฅ ๋ณ์(multiful r.v.s)์ ์ํ ๋ถํฌ์ ๋๋ค.
X, Y๋ผ๋ ๋๊ฐ์ ํ๋ฅ ๋ณ์๊ฐ ์์ ๋, X์ Y์ ๊ฒฐํฉ๋ถํฌ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$P(X = x_1, Y = y_1)$$
์ด๋ฌํ ๊ฒฝ์ฐ Sample Space(ํ๋ณธ๊ณต๊ฐ)๋ X๊ฐ ์ ์๋ Sample Space์ Y๊ฐ ์ ์๋ Sample Space์ ์นดํ ์์ ๊ณฑ(์ฆ ์์์)์ผ๋ก ํ์ฅ๋ฉ๋๋ค.
๋ฐ๋ผ์ Sample Space๊ฐ ํ์ฅ๋๊ธฐ์, ํ๋ฅ ๋ณ์์ ์น์ญ๋ X์ Y์ ์น์ญ์ ์นดํ ์์ ๊ณฑ์ผ๋ก ํ์ฅ๋ฉ๋๋ค.
์ฐ์ ์ฌ๋ฌ๊ฐ์ ํ๋ฅ ๋ณ์(r.v.s)์ ๋ํ CDF๋ฅผ ์์๋ณด๋๋ก ํ๊ฒ์ต๋๋ค.
marginal distribution (์ฃผ๋ณ๋ถํฌ)
์ฌ๋ฌ๊ฐ์ ํ๋ฅ ๋ณ์๋ก ์ด๋ฃจ์ด์ง Joint c.d.f๋ p.d.f, p.m.f๊ฐ ์์ ๋ ๊ฐ๊ฐ์ ๋ณ์ ํ๋ํ๋์ ๋ํ c.d.f, p.d.f ๋๋ p.f์ Marginal ์ด๋ผ๋ ๋จ์ด๋ฅผ ๋ถ์ฌ์ ํํํฉ๋๋ค.
๋ํ Marginal Distribution์ ๊ตฌํ๊ณ ์ถ์ ๊ฒฝ์ฐ, ๊ตฌํ๊ณ ์ถ์ ๋ณ์ ์ด์ธ์ ๋ค๋ฅธ ๊ฐ์ ๋ชจ๋ ๊ฒฝ์ฐ๋ฅผ ๋ค ๊ณ ๋ คํด์ค๋ค๋ฉด ๊ตฌํ๊ณ ์ถ์ ๋ณ์์ ๋ํ dritribution์ ๊ตฌํ ์ ์์ต๋๋ค.
์๋ฅผ ๋ค์ด Joint c.d.f ์ธ ๊ฒฝ์ฐ
$$F_x(x) = F_{xy}(x, \infty)$$
$$F_y(y) = F_{xy}(\infty, y)$$
Joint Cumulative Distribution Function (Joint CDF, ๊ฒฐํฉ ๋์ ๋ถํฌํจ์)
Joint CDF๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ํํํ๊ฒ ์ต๋๋ค.
$$F_{xy}(x, y)\overset{\underset{\mathrm{def}}{}}{=}P(X\leq x, Y \leq y)$$
์ด๊ฒ(cdf)์ด ์๋ฏธํ๋ ๊ฒ์ ์๋ ํ์๋ ๋ถ๋ถ์ ์์ญ์ x, y ์ขํ๊ฐ ๋ค์ด์ค๊ฒ ๋ ํ๋ฅ ์ ๋๋ค.
Joint CDF์ ํน์ง๋ค์ ์์๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
Properties of Joint CDF
1) CDF๋ ํ๋ฅ ์ด๊ธฐ ๋๋ฌธ์ ์๋๊ฐ ์ฑ๋ฆฝํฉ๋๋ค.
$$ 0\leq F_{xy}(x, y)\leq 1 $$
2) Joint CDF๋ non-decreasing surface์ ๋๋ค. ๋ฐ๋ผ์
$$for \quad x_1 < x_2, \; y_1 < y_2 $$
$$ F_{xy}(x_1, y_1) \leq F_{xy}(x_1, y_2) \leq F_{xy}(x_2, y_2)$$
$$ F_{xy}(x_1, y_1) \leq F_{xy}(x_2, y_1) \leq F_{xy}(x_2, y_2)$$
(surface๋ผ๊ณ ํํํ ๊ฒ์ function์ด๋ผ ํํํ ๊ฒฝ์ฐ ๊ณก์ ๋ฑ์ ์๊ฐํ ๊ฒ์ด๊ธฐ ๋๋ฌธ์, ์ด๋ฅผ ๋ช ํํ ํ๊ธฐ ์ํด surface๋ผ๊ณ ํํํ์์ต๋๋ค. RV๊ฐ 1๊ฐ์ผ ๋๋ CDF๋ ๊ณก์ ์ผ๋ก ํํ๋์ง๋ง, RV๊ฐ 2๊ฐ์ผ ๊ฒฝ์ฐ CDF๋ ๊ณก๋ฉด์ผ๋ก ํํ๋ฉ๋๋ค.)
์๋๋ ์ดํด๋ฅผ ๋๊ธฐ ์ํ Joint CDF์ ๊ทธ๋ฆผ์ ๋๋ค.
$$3) \;\;\; \displaystyle \lim_{ {x\to \infty \; y\to \infty}}F_{xy} = P(X\leq \infty , Y\leq \infty) = 1$$
$$4) \;\;\;\displaystyle \lim_{ {x\to -\infty }}F_{xy} = P(X\leq -\infty , Y\leq y) = 0$$
$$\displaystyle \lim_{ {y\to -\infty }}F_{xy} = P(X\leq x , Y\leq -\infty) = 0$$
$$5) \;\;\;P(x_1 < X \leq x_2,\; Y\leq y)$$ ์ ์์ ์๋ ๋ฉด์ ์ ๋์ด๋ฅผ ๊ตฌํ๋ ๊ฒ์ ๋๋ค.
์ฆ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$F_{xy}(x_2, y) - F_{xy}(x_1, y)$$
$$6) \;\;\;P(x_1 < X \leq x_2,\; y_1<Y\leq y_2)$$ ์ ์์ ์๋ ์ฃผํฉ์ ๋ถ๋ถ์ ๋ฉด์ ์ ๋์ด๋ฅผ ๊ตฌํ๋ ๊ฒ์ ๋๋ค.
(์ฌ์ค ๋ถํผ๋ฅผ ๊ตฌํ๋ ๊ฒ์ด๋, ์ข ๋ ํธํ๊ฒ ์ดํดํ๊ธฐ ์ํด ํ๋ฉด์ผ๋ก ๊ทธ๋ ธ์ต๋๋ค.)
์ฆ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$F_{xy}(x_2, y_2) - F_{xy}(x_1, y_2)- F_{xy}(x_2, y_1) + F_{xy}(x_1, y_1)$$
marginal CDF
Joint CDF์ ๋ํด์ ๋ค๋ฅธ ๋ณ์๋ฅผ ๋ฌดํ๋๋ก ๋ณด๋ด๋ฒ๋ฆฌ๋ฉด(์ฆ ๋ชจ๋ ์กฐ๊ฑด์ ๋ค ์๊ฐํ๋ค๋ฉด) ๋๋จธ์ง ๋ณ์์ ๋ํ marginal CDF๋ฅผ ์ป์ ์ ์์ต๋๋ค.
$$F_x(x) = F_{xy}(x, \infty)$$
$$F_y(y) = F_{xy}(\infty, y)$$
Joint Probability Mass Function (Joint p.m.f , p.f)
2๊ฐ์ Discrete Random Variables์ ๋ํ ํ๋ฅ ๋ถํฌ ์ฆ Joint Probability Mass Function์ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋ฉ๋๋ค.
$$\forall{(x, y) \in R^{2} } , \;\;\; f(x,y) = P(X=x \;and \; Y = y)$$
X = x ์ธ ๊ฒฝ์ฐ์ ํ๋ฅ ๊ณผ Y = y์ธ ๊ฒฝ์ฐ์ ํ๋ฅ ์ ๊ตฌํด์ ๊ณฑํ๋ฉด ๋์ง ์์๊น๋ ์๊ฐ์ ํ ์๋ ์๋๋ฐ, ์ด๋ Independentํ ์ํฉ์์๋ง ์ฑ๋ฆฝํ๋ฉฐ, ์ผ๋ฐ์ ์ผ๋ก๋ ์ฑ๋ฆฝํ์ง ์์ต๋๋ค.
Properties of Joint PMF
1)๋ง์ฝ (X , Y)๊ฐ ์์์ (x, y)๋ฅผ ๊ฐ์ง ์๋๋ค๋ฉด, ํด๋น ํ๋ฅ ์ 0์ ๋๋ค.
$$if\;\; (X, Y)\;\; cannot \;\; have \;\; a \;\; ordered\;\; pair\;\; (x,y) \;\; then \;\;f(x, y) = 0 $$
2) ๋ชจ๋ (X, Y) ์์์์ ํ๋ฅ ์ ๋ํ ๊ฐ์ 1์ ๋๋ค.
$$\sum_{x}^{}\sum_{y}^{} P_{xy}(x,y)=1$$
3) ํ๋ฅ ์ด๋ฏ๋ก 0๊ณผ 1 ์ฌ์ด์ ๊ฐ์ ๊ฐ์ง๋๋ค.
$$0\leq p_{xy}(x, y)\leq 1$$
4)๋์ ๋ถํฌํจ์๋ ๋ค์๊ณผ ๊ฐ์ด ๊ตฌํฉ๋๋ค.
$$F_{xy}(x,y) = P(X \leq x, Y \leq y) = \sum_{X\leq x}^{}\sum_{Y\leq y}^{}P_{xy}(x,y)$$
marginal PMF
$$P_x(x)=\sum_{y}^{}P_{xy}(x,y)$$
$$P_y(y)=\sum_{x}^{}P_{xy}(x,y)$$
Independent ์ธ ๊ฒฝ์ฐ
$$P_{xy}(x, y)=P_x(x) P_y(y)$$
Joint Probability Density Function (Joint p.d.f)
์๋์ ๊ฐ์ ์์ด ์๋ ํจ์ f๋ฅผ ๊ฐ์ง ๋, X์ Y๋ continuous joint distribution ๋ฅผ ๊ฐ์ง๋ค๊ณ ํฉ๋๋ค.๋๋ค.
$$P((X,Y) \in C \subset R^{2}) = \int_{C} \int f(x, y) dxdy$$
๊ทธ๋ฆฌ๊ณ ์ด๋์ f๋ฅผ joint probability density function (joint p.d.f)๋ผ๊ณ ํฉ๋๋ค.
PDF๋ CDF๋ฅผ ๋ฏธ๋ถํ๋ฉด ๊ตฌํ ์ ์์์ต๋๋ค. ๋ฐ๋ผ์
$$f_{xy}(x,y) \overset{\underset{\mathrm{def}}{}}{=} \frac{\partial^{2} F_{xy}(x,y)}{\partial x \partial y }$$
๋ํ CDF๋ PDF๋ฅผ ์ ๋ถํ๋ฉด ๊ตฌํ ์ ์์ผ๋ฏ๋ก
$$F_{xy}(x, y) = \int_{-\infty}^{y} \int_{-\infty}^{x} f_{xy}(u ,v)dudv$$
Properties of Joint PDF
1) x y ํ๋ฉด์ ๋ชจ๋ ๊ฐ๊ฐ์ ํ ์ (point)์์์ ํ๋ฅ ์ 0์ ๋๋ค.
2)(x, y)๊ฐ ํ๋ฉด์ด ์๋ ํ๋์ ์ง์ ์์ ์กด์ฌํ ๊ฒฝ์ฐ, ์ด์ ๋ํ ํ๋ฅ ์ 0์ ๋๋ค.
$$when \;\; C = \left\{ (x, y) | y =f(x) \right\} \;\; or \;\; C = \left\{ (x, y) | x =f(y)\right\} $$
$$then \;\; \int \int f(x, y)dxdy = 0$$
3) ํ๋ฅ ์ด๋ฏ๋ก ๋ค์์ด ์ฑ๋ฆฝํฉ๋๋ค.
$$)1 \geq f(x, y ) \geq 0$$
4) ๋ชจ๋ ๊ฒฝ์ฐ์ ํ๋ฅ ์ ๋ค ๋ํ ๊ฐ์ 1์ ๋๋ค.
$$\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}f_{xy}(x, y)dxdy = 1 = F_{xy}(\infty, \infty)$$
5) (X, Y)๊ฐ ํน์ ๊ตฌ๊ฐ์ ์กด์ฌํ ํ๋ฅ ์ ๋ค์๊ณผ ๊ฐ์ด ๊ตฌํฉ๋๋ค.
$$P(x_1 < X\leq X_2, y_1< Y\leq y_2) = \int_{y_1}^{y_2}\int_{x_1}^{x_2}f_{xy}(x,y)dxdy$$
$$= F_{xy}(x_2, y_2)-F_{xy}(x_1, y_2) - F_{xy}(x_2, y_1) + F_{xy}(x_1, y_1)$$
๋ํ ์ด๊ณณ์์ ์ด์ค์ ๋ถ์ ๋ถํผ๋ฅผ ๊ตฌํ๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค
marginal PDF
$$f_x(x) = \int_{-\infty}^{\infty} f_{xy}(x, y) dy$$
$$f_y(y) = \int_{-\infty}^{\infty}f_{xy}(x,y)dx$$
Independent ์ธ ๊ฒฝ์ฐ
$$f_{xy}(x, y) =f_x(x)f_y(y)$$
๋ํ x์ y์ ๋ฒ์๊ฐ unboundedํ ๊ฒฝ์ฐ(x >=0, y>=0),
$$f(x, y) = h(x)\cdot h(y)$$ ์ผ๋,
h(x)๋ ์ค์ง x์ ์ํด์๋ง ์ํฅ์ ๋ฐ๊ณ , h(y)๋ y์ ์ํด์๋ง ์ํฅ์ ๋ฐ์ผ๋ฏ๋ก,
X์ Y๋ independent ํฉ๋๋ค.
์์
1๊ฐ์ ๋์ ์ 3๋ฒ ๋์ง๋ค๊ณ ๊ฐ์ ํด ๋ณด๊ฒ ์ต๋๋ค.
X : ๋งจ ์ฒ์ ๋์ ์ด H๊ฐ ๋์ค๋ฉด 1, T๊ฐ ๋์ค๋ฉด 0
Y : ์ด H๊ฐ ๋์จ ํ์
์ด๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$P_x(0) = \frac{1}{2}, \; P_x(1) = \frac{1}{2}, \;\;P_y(0) = \frac{1}{8}, \; P_y(1) = \frac{1}{4}, \;\;P_y(2) = \frac{1}{4}, \; P_y(3) = \frac{1}{8},$$
X |Y | 0 | 1 | 2 | 3 |
0 | P(0, 0) = 1/8 | P(0, 1) = 2/8 | P(0, 2) = 1/8 | 0 |
1 | 0 | P(1, 1) = 1/8 | P(1, 2) = 2/8 | P(1, 3) = 1/8 |
$$\sum_{x=0}^{1}P_x(x) = 1$$
$$\sum_{y=0}^{3}P_y(y) = 1$$
$$\sum_{y=0}^{3}\sum_{x=0}^{1}P_{xy}(x,y) = 1$$
์ถ๊ฐ๋ก joint probability ๋ก๋ถํฐ X์ ๋ํ marginal probability๋ฅผ ๊ตฌํด๋ณด๊ฒ ์ต๋๋ค.
$$P_x(0) = \sum_{y=0}^{3}P_{xy}(0, y ) = \frac{1}{2}$$
$$P_y(2) = \sum_{x=0}^{1}P_{xy}(x, 2 ) = \frac{3}{8}$$
์ถ๊ฐ๋ก Independent์ ์ฌ๋ถ๋ฅผ ๊ตฌํด๋ณด๊ฒ ์ต๋๋ค.
$$P_{xy}(0, 2) = \frac{1}{8} $$
$$P_x(0)P_y(2) =\frac{1}{2} * \frac{3}{8} = \frac{3}{16} \neq P_{xy}(0, 2) $$
๋ฐ๋ผ์ X์ Y๋ Independent๊ฐ ์๋๋๋ค.
2๋ฒ
$$P_{xy}(x,y)= k(2x+y)$$
์ ๋ํด,
x = 1,2
y = 1,2
์ด๋ค.
์ด๋ k, marginal Prob, Independent ์ฌ๋ถ๋ฅผ ๊ตฌํด๋ณด๊ฒ ์ต๋๋ค.
$$\sum_{x=1}^{2}\sum_{y=1}^{2}k(2x+y) = 1$$
์ด๋ฏ๋ก,
k(3 + 4 + 5 + 6) = 1์ด๋ฉฐ, ๋ฐ๋ผ์
$$ k = \frac{1}{18}$$
marginal Prob๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$P_x(x) = \sum_{y=1}^{2}\frac{1}{18}(2x + y) = \frac{1}{18}(4x+3)$$
$$P_y(y) = \sum_{x=1}^{2}\frac{1}{18}(2x + y) = \frac{1}{18}(2y+6)$$
Independent ์ฌ๋ถ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค
$$\frac{1}{18}(2x+y) \neq \frac{1}{18}(4x+3) * \frac{1}{18}(2y+6)$$
์ด๋ฏ๋ก Independentํ์ง ์์ต๋๋ค.