Moments(์ ๋ฅ )
Moments(์ ๋ฅ )๋ ํ๋ฅ ๋ณ์๋ฅผ ์์ฝํ๋๋ฐ ์ฌ์ฉ๋๋ ๋ ๋ค๋ฅธ ์๋จ์ ๋๋ค.
Moment๋ฅผ ์ด์ฉํ์ฌ ๊ธฐ๋๊ฐ, ๋ถ์ฐ, Skewness(์๋), Kurtosis(์ฒจ๋)๋ฑ์ ์ธก์ ํ ์ ์์ต๋๋ค.
์ ์๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$K-th \;\; Moment \overset{\underset{\mathrm{def}}{}}{=}E(X^{k}),\;\;\;\;\; (k\geq 1)$$
k-th moment๊ฐ ์กด์ฌํ๊ธฐ ์ํด์๋ ๋ค์ ์กฐ๊ฑด์ ๋ฐ๋์ ๋ง์กฑํด์ผ ํ๋ฉฐ,
๋ค์ ์กฐ๊ฑด์ ๋ง์กฑํ๋ค๋ฉด k-th moment๊ฐ ์กด์ฌํ๋ ๊ฒ์ ๋๋ค.
$$E(|X|^{k}) < \infty$$
๋ง์ฝ ํ๋ฅ ๋ณ์ X๊ฐ bounded(์ ๊ณ)์ธ ๊ฒฝ์ฐ, ์ฆ ์ ํํ ๋ ์ a, b์ ๋ํด ๋ค์์ ๋ง์กฑํ๋ ๊ฒฝ์ฐ X์ ๋ชจ๋ moment๋ ๋ฐ๋์ ์กด์ฌํฉ๋๋ค.
$$P(a \leq X \leq b) = 1$$
Moments์ ์์ฑ
1) ๋ง์ฝ k๋ฒ์งธ moment๊ฐ ์กด์ฌํ๋ค๋ฉด, k๋ณด๋ค ์์ j์ ๋ํด, j๋ฒ์งธ moment๋ ๋ํ ์กด์ฌํฉ๋๋ค.
์ฆ๋ช )
X๋ฅผ ์ฐ์ํ๋ฅ ๋ณ์๋ผ ๊ฐ์ ํ๋๋ก ํ๊ฒ ์ต๋๋ค.
์ ํฌ๋ j๋ฒ์งธ Moment๊ฐ ์กด์ฌํจ์ ์ฆ๋ช ํ๊ธฐ ์ํด ๋ค์์ ๋ณด์ด๋ฉด ๋ฉ๋๋ค.
$$E(|X|^{k}) < \infty$$
$$E(|X|^{j}) \overset{\underset{\mathrm{LOTUS}}{}}{=} \int_{-\infty}^{\infty}|X|^{j}f(x)dx$$
$$=\int_{|X|\leq 1}|X|^{j}f(x)dx + \int_{|X|> 1}|X|^{j}f(x)dx $$
$$\leq \int_{|X|\leq 1}^{}f(x)dx + \int_{|X|>1}^{}|X|^{k}f(x)dx \;\;\;\; \because \;\; |X|^{j} < |X|^{k}$$
$$= P(|X| \leq 1) + E(|X|^{k})$$
$$์ด๋ \;\; P(|X| \leq 1) \leq 1์ด๊ณ ,\;\; E(|X|^{k})<\infty $$
๋ฐ๋ผ์ ๋ ํญ ๋ชจ๋ bounded( ๋ฌดํ๋๋ณด๋ค ์์ )์ ๋๋ค.
๋ฐ๋ผ์ ๋ค์ ์๋ bounded์ด๋ฉฐ, ๋ฐ๋ผ์ j๋ฒ์งธ moment๋ ์กด์ฌํฉ๋๋ค.
$$\int_{|X|\leq 1}|X|^{j}f(x)dx + \int_{|X|> 1}|X|^{j}f(x)dx $$
moment generating function (์ ๋ฅ ์์ฑํจ์, m.g.f )
ํ๋ฅ ๋ณ์ X์ ์ค์ t๊ฐ ์ฃผ์ด์ก์ ๋,
X์ ๋ํ m.g.f(์ ๋ฅ ์์ฑํจ์)Ψ(t) ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$\psi(t) = E(e^{tX})$$
์ด๋ Ψ(t)๋ ์ค์ง X์ ๋ถํฌ์๋ง ์์กด์ ์ ๋๋ค.(์ํฅ์ ๋ฐ์ต๋๋ค.)
๋ง์ฝ ๋ ํ๋ฅ ๋ณ์ X์ Y์ m.g.f๊ฐ ๋์ผํ๋ค๋ฉด, X์ Y๋ ๋์ผํ ๋ถํฌ๋ฅผ ๊ฐ์ต๋๋ค.
Moment๋ฅผ ๊ตฌํ๋ ๋ฒ
X์ ๋ํ n์ฐจ moment๋ฅผ ๊ตฌํ๊ธฐ ์ํด์
m.g.f๋ฅผ n๋ฒ ๋ฏธ๋ถํ ํ t=0์ ๋์ ํ๋ฉด n์ฐจ moment๋ฅผ ์ป์ ์ ์์ต๋๋ค.
์ด๋ Ψ(t)๋ 0 ์ฃผ๋ณ์ ์ด๋ฆฐ ๊ตฌ๊ฐ์ ์ํ ๋ชจ๋ t๊ฐ๋ค์ ๋ํด ์ ํ(finite)ํด์ผ ํฉ๋๋ค.
๊ณต์์ผ๋ก๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$E(X^{n}) = \psi^{(n)}(0)$$
์ด๋ Ψ^n์ Ψ์ n์น์ด ์๋๋ผ, Ψ๋ฅผ n๋ฒ ๋ฏธ๋ถํ๋ค๋ ๋ป์ ๋๋ค.
์์๋ฅผ ๋ค์ด๋ณด๊ฒ ์ต๋๋ค.
X๋ ์ฐ์ํ๋ฅ ๋ณ์์ด๋ฉฐ, p.d.f์ธ f(x)๋ฅผ ๊ฐ์ง๋ค๊ณ ํ๊ฒ ์ต๋๋ค.
$$f(x)=
\left\{\begin{matrix}
e^{-x} & x>0 \\
0& otherwise\\
\end{matrix}\right. $$
X์ ๋ํ m.g.f๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$\psi(t) = E(e^{tX})$$
์ด์ n์ฐจ ์ ๋ฅ ์ ๊ตฌํด๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
$$E(e^{tx}) = \int_{0}^{\infty}e^{tx} \cdot f(x) dx = \int_{0}^{\infty}e^{tx} \cdot e^{-x} dx $$
$$=\int_{0}^{\infty}e^{x(t-1)}dx$$
์ด๋ ๋ค์๊ณผ ๊ฐ์ด ์นํํ๋ฉด $$y = (t-1)x$$
$$dy = (t-1)dx$$
์ด๋ t์ ๋ฒ์์ ๋ฐ๋ฅธ ๊ฐ์ ์ค์ ์ ํด์ฃผ์ด์ผ ํ๋๋ฐ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
t๊ฐ 1 ์ด์์ด๋ผ๋ฉด, 0์์ ๋ฌดํ๋์ ๋ฒ์๋ฅผ ์ ๋ถํ๊ฒ ๋๋ฉด ์ ๋ถ์ ๊ฐ์ unbounded(์ฆ infinte)ํ๊ฒ ๋๋ฉฐ, ๋ฐ๋ผ์ Ψ(t)๋ ์กด์ฌํ์ง ์์ต๋๋ค.
t๊ฐ 1 ๋ฏธ๋ง์ด๋ผ๋ฉด (t-1)์ ์์์ ๊ฐ์ ๊ฐ์ง๋ฏ๋ก, x๊ฐ 0์์ ๋ฌดํ๋๋ก ์ฆ๊ฐํจ์ ๋ฐ๋ผ, y๋ 0์์ -๋ฌดํ๋๋ก ํฅํ๊ฒ ๋ฉ๋๋ค.
๋ฐ๋ผ์ ๋ค์๊ณผ ๊ฐ์์ง๋๋ค.
$$(when \;\; t<1) \;\;\;\;\; \int_{0}^{-\infty}\frac{1}{t-1}\cdot e^{y}dy = \frac{1}{t-1}|^{-\infty}_0 $$
$$= \frac{1}{1-t}$$
$$\therefore \;\; \psi(t) = \frac{1}{1-t} = (1-t)^{-1}$$
๋ฐ๋ผ์ ์ด๋ฅผ ํตํด X์ ๋ํ n์ฐจ moment๋ฅผ ๊ตฌํ ์ ์์ต๋๋ค.
1์ฐจ moment
$$\psi'(0) = -(1-t)^{-2} = 1$$
2์ฐจ moment
$$\psi''(0) = 2(1-t)^{-3} = 2$$
๋ํ ์ด๋ฅผ ํตํด X์ ๋ํ ๋ถ์ฐ(Variance)๋ ์ฝ๊ฒ ๊ตฌํ ์ ์์ต๋๋ค.
$$Var(X) = E(X^{2}) - (E(X))^{2} = 2-1 = 1$$
m.g.f์ ์์ฑ
1. ํ๋ฅ ๋ณ์ X์ ๋ํ m.g.f๋ฅผ Ψ_1๋ผ ํ๊ณ Y = aX + b, Y์ ๋ํ m.g.f๋ฅผ Ψ_2๋ผ ํ๋ฉด
Ψ_1(at)๊ฐ ์ ์๋(์ฆ m.g.f๊ฐ finiteํ) ๊ตฌ๊ฐ์ ๋ํด์ Ψ_2๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ์ ์ํ ์ ์์ต๋๋ค.
$$\psi_2(t) = e^{bt} \cdot \psi_1(at)$$
์ฆ๋ช )
$$\psi_2(t) = E(e^{tY}) = E(e^{t(aX+b))})$$
$$ e^{tb}\cdot E(e^{taX}) \;\;\;\;\;\;\;beacuse\;\; e^{tb} \; is\;\; constant$$
$$=e^{tb}\cdot \psi_1(at)$$
2. X1, X2, ..., Xn์ด ์๋ก Independent์ธ ๊ฒฝ์ฐ Ψ_i๋ฅผ X_i์ m.g.f๋ผ๊ณ ํ๋ฉด, ๋ค์์ด ์ฑ๋ฆฝํฉ๋๋ค.
ํ๋ฅ ๋ณ์ Y๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ์ ์ํ๋ฉด
$$Y = X_1 + X_2 + \cdots + X_n$$
Y์ ๋ํ m.g.f์ธ Ψ(t)๋ ๋ชจ๋ i์ ๋ํด Ψ_i(t)๊ฐ ์ ์๋(์ฆ finiteํ ๊ฐ์ ๊ฐ์ง๋) ๋ชจ๋ t์ ๋ํ์ฌ, ๋ค์์ด ์ฑ๋ฆฝํฉ๋๋ค.
$$\psi(t) = \prod_{i=1}^{n}\psi_i(t)$$
์ฆ๋ช )
$$\psi(t) = E(e^{tY}) = E(e^{t(X_1 + X_2 + \cdots + X_n)})$$
$$=E(e^{tX_1}\cdot e^{tX_2}\cdots e^{tX_n})$$
$$=E(e^{tX_1}) \cdot E(e^{tX_2}) \cdots E(e^{tX_n}) \;\;\;\; since \;\; X_1, X_2, \cdots, X_n \;\; are \; mutually\; independent$$
$$= \prod_{i=1}^{n}\psi_i(t)$$
Median (์ค์๊ฐ)
X์ ๋ํ ๋ถํฌ(distribution)์ median(์ค์๊ฐ)์ ๋ค์์ ๋ง์กฑํ๋ ๋ชจ๋ m์ ๊ฐ(ํ๋๊ฐ ์๋์๋ ์์)์ ์๋ฏธํฉ๋๋ค.
$$1) \;\;\;P(X \geq m) \geq \frac{1}{2}$$
$$2) \;\;\; P(X \leq m) \geq \frac{1}{2}$$
1) ์ค์๊ฐ์ ์ฌ๋ฌ๊ฐ ์กด์ฌํ ์ ์์ต๋๋ค.
2) ๋ชจ๋ ๋ถํฌ๋ ์ต์ 1๊ฐ์ ์ค์๊ฐ์ ๊ฐ์ง๊ณ ์์ต๋๋ค.
์๋ฅผ ๋ค์ด๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
์ด์ฐํ๋ฅ ๋ณ์ X์ ๋ํด ๋ค์๊ณผ ๊ฐ๋ค๊ณ ํ๊ฒ ์ต๋๋ค.
$$P(X = 1) = 0.1, \;\;\; P(X= 2) = 0.2$$
$$P(X = 3) = 0.3, \;\;\; P(X= 4) = 0.4$$
์ด๋ Median์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$1) P(X \geq 3) = 0.7$$
$$2) P(X \leq 3) = 0.6$$
๋ฐ๋ผ์ Median ์ 3์ ๋๋ค.
๋ํ ์ฌ๋ฌ๊ฐ์ Median์ ๊ฐ์ง๋ ์์๋ ์๋์ ๊ฐ์ต๋๋ค.
์ฐ์ํ๋ฅ ๋ณ์ X์ ๋ํด p.d.f๊ฐ ๋ค์๊ณผ ๊ฐ๋ค๊ณ ํ๊ฒ ์ต๋๋ค.
$$f(X) = \left\{\begin{matrix}
\frac{1}{2} &0 \leq x\leq 1 \\
1 & 2.5 \leq x\leq 3\\
0 & otherwise \\
\end{matrix}\right.$$
์ด๋ [1, 2.5]์ ์ํ๋ ๋ชจ๋ m์ ์๋๋ฅผ ๋ง์กฑํ๊ธฐ์ median์ ๋๋ค.
$$1) P(X \geq m) = \frac{1}{2}$$
$$2) P(X \leq m) = \frac{1}{2}$$
Mean - square error (ํ๊ท ์ ๊ณฑ ์ค์ฐจ, MSE)
์คํ์ ํ๊ธฐ ์ ์คํ์ ๊ฒฐ๊ณผ๋ก ์์ธกํ ๊ฐ d์ ๋ํด์, ์ค์ ๋ก ๋์จ ๊ฒฐ๊ณผ X์ d ์ฌ์ด์ ์ฐจ์ด์ ํ๊ท ๊ตฌํ๊ณ ์ถ์ ์ ์์ต๋๋ค.
์ด๋ X์ d์ ์ค์ฐจ๋ ์์์ผ ์๋, ์์์ผ ์๋ ์์ผ๋, ์ฐ๋ฆฌ๊ฐ ์ํ๋ ๊ฒ์ ์ ๋์ ์ธ ์ฐจ์ด๋ฅผ ์ํ๋ ๊ฒ์ด๊ธฐ ๋๋ฌธ์ ์ด๋ฅผ ์ ๊ณฑ(square)ํ ๊ฐ์ ํ๊ท ๋ด์ด ๊ตฌํ ๊ฒ์ด๊ณ , ์ด๊ฒ์ด ๋ฐ๋ก MSE์ ๋๋ค.
์ฆ ๊ฐ๋จํ ๋งํด ์ค์ฐจ์ ์ ๊ณฑ์ ํ๊ท ์ ์ทจํ ๊ฒ์ ๋๋ค.
$$MSE \;\; of \; prediction \;d\;\;\; E((x-d)^{2})$$
MSE์ ์์ฑ
1) ํ๋ฅ ๋ณ์ X์ ํ๊ท ์ M, ๋ถ์ฐ์ σ^2๋ผ ํ๋ฉด, ๋ชจ๋ ์์ธก๊ฐ d์ ๋ํด ๋ค์์ด ์ฑ๋ฆฝํฉ๋๋ค.
$$E((X-M)^{2}) \leq E((X-d)^{2})$$
์ ์์ด ์๋ฏธํ๋ ๋ฐ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
์์ธก๊ฐ d๋ฅผ M์ผ๋ก ์์ธกํ์ ๋ MSE๋ฅผ ์ต์ํํ ์ ์๋ค.
์ฆ๋ช )
$$E((X-d)^{2}) = E(X^{2} - 2Xd + d^{2}) = E(X^{2}) - 2E(X)d + d^{2}$$
์ด๋ ์ด๋ฅผ d์ ๋ํ ํจ์๋ก ์๊ฐํ๋ฉด ์๋๋ก ๋ณผ๋ก์ธ 2์ฐจํจ์์ ํํ๋ฅผ ์๊ฐํ ์ ์์ผ๋ฉฐ,
์ด๋ ํด๋น ํจ์์ ์ต์๊ฐ์ ๋ฏธ๋ถํ ๊ฐ์ด 0์ด ๋๋ ์ง์ ์ ๋๋ค.
์ฆ ์ ์์ ๋ฏธ๋ถํ ๊ฐ์ด 0์ผ ๋, ์ฆ
$$2d + 2E(X) = 0$$
์ผ ๋ ํด๋น ํจ์๋ ์ต์๊ฐ์ ๊ฐ์ต๋๋ค.
๋ฐ๋ผ์ ์์ธก๊ฐ d๋ฅผ M์ผ๋ก ์์ธกํ์ ๋, MSE๊ฐ ์ต์๊ฐ์ด ๋ฉ๋๋ค.