์นด์ด์ ๊ณฑ ๋ถํฌ
์นด์ด์ ๊ณฑ ๋ถํฌ๋ฅผ ๋ฐฐ์ฐ๊ธฐ ์ ์ ์นด์ด์ ๊ณฑ ๋ถํฌ๋ฅผ ์ ๋ฐฐ์ฐ๋์ง, ์ด๋จ ๋ ์ฌ์ฉํ๋์ง ์์๋ณด๊ฒ ์ต๋๋ค.
์นด์ด์ ๊ณฑ ๋ถํฌ๋ ํ๋ณธ๋ค์ ํ๊ท ๊ณผ ๋ถ์ฐ์ ํตํด,
์ ๊ท๋ถํฌ๋ฅผ ๋ฐ๋ฅด๋ ๋ชจ์ง๋จ์ ๋ถ์ฐ, ์ฆ ๋ชจ๋ถ์ฐ์ ์ถ์ ํ ๋ ์ฌ์ฉํฉ๋๋ค.
์ด์ ์๋ ๋ง์๋๋ ธ๋ค์ถ์ด, ์ ํฌ์ ๋ชฉ์ ์ ํ๋ณธ๋ค์ ๊ฐ์ง๊ณ ๋ชจ์๋ฅผ ์ถ์ ํ๊ฑฐ๋, ๋ชจ์์ ๋ํ ๊ฐ์ค์ ๊ฒ์ ํ๋ ๊ฒ์ด์์ต๋๋ค.
๊ทธ์ค ๋ชจ์ง๋จ์ ๋ถ์ฐ์ ์ถ์ ํ๋ ๋ฐฉ๋ฒ์ ์ฌ์ฉ๋๋ ๊ฒ์ด ๋ฐ๋ก ์นด์ด์ ๊ณฑ๋ถํฌ์ ๋๋ค.
๋ง๋ณด๊ธฐ๋ก ์ด๋ป๊ฒ ์ถ์ ์ด ๊ฐ๋ฅํ์ง ์ดํด๋ณด๊ฒ ์ต๋๋ค.
(์นด์ด์ ๊ณฑ ๋ถํฌ์ ์์ ๋๋ผ๋๊ฐ, ์์ด ๋์ถ๋๋ ๊ณผ์ ์ ์๋ตํ๊ณ , ์ถ์ ์ด ๊ฐ๋ฅํ ์ด์ ์ ๋ํด์๋ง ์ดํด๋ณด๊ฒ ์ต๋๋ค.)
์ฐ์ ๋ค์์ ์์ ๋ n์ธ ์นด์ด์ ๊ณฑ ๋ถํฌ๋ฅผ ์๋ฏธํฉ๋๋ค.
๊ฐ ์์ ๋์ ๋ํ ์นด์ด์ ๊ณฑ๋ถํฌ๋ ์ด๋ฏธ ๊ตฌํด์ ธ์์ผ๋ฉฐ, ๋๋ถ๋ถ ํ๋ก ์ฃผ์ด์ง๋๋ค.
$$\chi^{2}(n)$$
ํ๊ท ์ ์๋ ค์ก์ผ๋ ๋ถ์ฐ์ ๋ชจ๋ฅด๋ ์ ๊ท๋ถํฌ๋ฅผ ๋ฐ๋ฅด๋ ๋ชจ์ง๋จ์์
๋ ๋ฆฝ์ ์ผ๋ก n๊ฐ์ ํ๋ณธ์ ์ถ์ถํ์์ ๋, ์๋ ์์ ์นด์ด์ ๊ณฑ ๋ถํฌ๋ฅผ ๋ฐ๋ฆ ๋๋ค.
$$\frac{\sum^{n}_{i=1}(X_i - \mu)^{2}}{\sigma^{2}} \; \sim \; \chi^{2}(n)$$
ํ๊ท ๊ณผ ๋ถ์ฐ ๋ชจ๋ ๋ชจ๋ฅด๋ ์ ๊ท๋ถํฌ๋ฅผ ๋ฐ๋ฅด๋ ๋ชจ์ง๋จ์์ ๋ ๋ฆฝ์ ์ผ๋ก n๊ฐ์ ํ๋ณธ์ ์ถ์ถํ์์ ๋, ์๋ ์์ ์นด์ด์ ๊ณฑ ๋ถํฌ๋ฅผ ๋ฐ๋ฆ ๋๋ค.
$$\frac{\sum^{n}_{i=1}(X_i - \overline{X}_n)^{2}}{\sigma^{2}} \; \sim \; \chi^{2}(n-1)$$
์ ์ ๋ ์์ ์ดํด๋ณด๊ฒ ์ต๋๋ค.
์ ํฌ๋ ์ด๋ฏธ ํ๋ณธ๋ค์ ์ถ์ถํ์ฌ ์กฐ์ฌํ์๊ธฐ์, ๊ฐ ํ๋ณธ๋ค์ ๊ฐ์ ์๊ณ ์์ต๋๋ค.
๋ํ ์นด์ด์ ๊ณฑ ๋ถํฌ์ ๊ฐ๋ ์ด๋ฏธ ๊ตฌํด์ง ๊ฐ์ด๋ฏ๋ก, ์ด๋ ์๊ณ ์๋ ๊ฐ์ ๋๋ค.
์ด๋ ์ฒซ ์์์ ๋ชจํ๊ท ์ธ μ๋ ์ฃผ์ด์ก์ผ๋ฏ๋ก ์ด๋ ์๊ณ ์์ต๋๋ค.
๋๋ฒ์งธ ์์์๋ ๋ชจํ๊ท ์ ๋ชจ๋ฅด์ง๋ง ๋ชจํ๊ท ๋์ ํ๋ณธํ๊ท ์ ์ฌ์ฉํ๋ฉฐ, ์ด๋ ํ๋ณธ๋ค์ ํตํด ๊ตฌํ ์ ์์ผ๋ฏ๋ก ์๊ณ ์๋ ๊ฐ์ ๋๋ค.
์ฆ ์ ๋ ์์์ ๊ฒฐ๊ตญ ๋ฏธ์ง์๋ ๋ชจ๋ถ์ฐ์ธ σ์ ๋๋ค.
์ฆ ๋ชจ์ง๋จ์ ์ ๋ณด๋ฅผ ๋ชจ๋ฅธ๋ค๊ณ ํ๋๋ผ๋, ์นด์ด์ ๊ณฑ ๋ถํฌ๋ฅผ ์ฌ์ฉํ๋ฉด ํ๋ณธ์ ํตํด ๋ชจ์ง๋จ์ ๋ถ์ฐ์ ์ถ์ถํ ์ ์๊ฒ ๋ฉ๋๋ค.
์ด๊ฒ์ด ์นด์์ ๊ณฑ๋ถํฌ๋ฅผ ๋ฐฐ์ฐ๋ ์ด์ ์ ๋๋ค.
์นด์ด์ ๊ณฑ ๋ถํฌ๋ ์ ๊ท๋ถํฌ๋ฅผ ๋ฐ๋ฅด๋ ๋ชจ๋ถ์ฐ์ ์ถ์ ํ ๋ ์ฌ์ฉ๋๋ฉฐ, ๋ชจ๋ถ์ฐ์ ๋ํ ์ ๋ขฐ๊ตฌ๊ฐ์ด๋ ๊ฐ์ค๊ฒ์ ์์ ์ฌ์ฉ๋๋ค
์ฐ์ ์ ๊ท๋ถํฌ์ ๊ธฐ๋ณธ์ ์ธ ์ถ์ ๋์ ๋ํด ์ ๋ฆฌํ๊ณ , ์นด์ด์ ๊ณฑ ๋ถํฌ์ ์ ์์ ๊ธฐ๋ณธ์ ์ธ ์์ฑ๋ค์ ์ดํด๋ณธ ์ดํ, ์นด์ด์ ๊ณฑ ๋ถํฌ๊ฐ ์ด๋ป๊ฒ ์ ์ฉ๋๋์ง ์ดํด๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
์ ๊ท๋ถํฌ์ ์ถ์ ๋
๋ค์๊ณผ ๊ฐ์ 3๊ฐ์ง ๊ฒฝ์ฐ์ ๋ํด ์ดํด๋ณด๊ฒ ์ต๋๋ค.
- ํ๊ท ๋ง ๋ชจ๋ฅด๋ ๊ฒฝ์ฐ
- ํ๊ท ๊ณผ ๋ถ์ฐ ๋ ๋ค ๋ชจ๋ฅด๋ ๊ฒฝ์ฐ
- ๋ถ์ฐ๋ง ๋ชจ๋ฅด๋ ๊ฒฝ์ฐ
1. ํ๊ท ๋ง ๋ชจ๋ฅด๋ ๊ฒฝ์ฐ
$$\sigma^{2}:\; known, \;\;\; \mu \;:\; unknown$$
ํ๊ท ์ ๋ํ ์ต๋์ฐ๋์ถ์ ๋(MLE)์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$MLE\;\; \hat{\mu} \;\; of \;\; \mu \;\; = \;\; \overline{X_n}$$
2. ํ๊ท ๊ณผ ๋ถ์ฐ ๋ ๋ค ๋ชจ๋ฅด๋ ๊ฒฝ์ฐ
$$\sigma^{2}:\; unknown, \;\;\; \mu \;:\; unknown$$
ํ๊ท ๊ณผ ๋ถ์ฐ์ ๋ํ ์ต๋์ฐ๋์ถ์ ๋(MLE)์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$MLE\;\; of \;\; (\hat{\mu}, \hat{\sigma^{2}}) \;\; \to$$
$$\hat{\mu} = \overline{X_n}$$
$$\hat{\sigma^{2}} =\frac{\sum^{n}_{i=1}(X_i- \overline{X_n})^{2}}{n}$$
3. ๋ถ์ฐ๋ง ๋ชจ๋ฅด๋ ๊ฒฝ์ฐ
$$\sigma^{2}:\; unknown, \;\;\; \mu \;:\; known$$
๋ถ์ฐ์ ๋ํ ์ต๋์ฐ๋์ถ์ ๋(MLE)์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$MLE\;\; \hat{\sigma^{2}_o}\;\; of \;\; \sigma^{2} \;\; = \;\; \frac{ \sum^{n}_{i=1}(X_i- \mu)^{2} } {n}$$
์ด์ ๋ํ ์ฆ๋ช ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
1. ํ๊ท ๋ง ๋ชจ๋ฅด๋ ๊ฒฝ์ฐ์ ๋ํ ์ฆ๋ช
2. ํ๊ท ๊ณผ ๋ถ์ฐ์ ๋ชจ๋ ๋ชจ๋ฅด๋ ๊ฒฝ์ฐ์ ๋ํ ์ฆ๋ช
3. ๋ถ์ฐ๋ง ๋ชจ๋ฅด๋ ๊ฒฝ์ฐ์ ๋ํ ์ฆ๋ช
์นด์ด์ ๊ณฑ ๋ถํฌ์ ์ ์
์นด์ด์ ๊ณฑ ๋ถํฌ๋ ๊ฐ๋ง ๋ถํฌ์ ํน์ํ ํํ๋ก, ์ ํํ๋ ๊ฐ๋ง ๋ถํฌ์์ a = m/2, b = 1/2์ธ ๋ถํฌ๋ฅผ ๋ํ๋ ๋๋ค.
์์ m์ ๋ํ์ฌ, ๋ค์๊ณผ ๊ฐ์ p.d.f๊ฐ ๋ฐ๋ฅด๋ ๋ถํฌ๋ฅผ ์์ ๋(degree of freedom, dof) m์ ๊ฐ์ง ์นด์ด์ ๊ณฑ ๋ถํฌ๋ผ ํฉ๋๋ค.
$$f(\;x\;|\;m\;) = \frac{1}{2^{\frac{m}{2} \cdot \Gamma(\frac{m}{2})}} \cdot x^{(\frac{m}{2})-1}\cdot e^{-\frac{x}{2}} $$
์๋ x>0์ธ ๊ฒฝ์ฐ์๋ง ์ฑ๋ฆฝํ๋ฉฐ, 0 ์ดํ์ผ ๊ฒฝ์ฐ์ p.d.f๋ 0์ ๋๋ค.
ํ๋ฅ ๋ณ์ X๊ฐ ์์ ๋(dof) m์ ๊ฐ์ง ์นด์ด์ ๊ณฑ ๋ถํฌ๋ฅผ ๋ฐ๋ฅผ ๋, ๋ค์๊ณผ ๊ฐ์ด ๋ํ๋ ๋๋ค.
$$X \; \sim \; \chi^{2}(m)$$
๊ฐ๋ง ํจ์(Gamma function)
์นด์ด์ ๊ณฑ ๋ถํฌ์ ๋ฑ์ฅํ๋ ๊ฐ๋ง ํจ์์ ๋ํด ๊ฐ๋จํ๊ฒ๋ง ์์๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
๋ชจ๋ α > 0์ ๋ํ์ฌ, ๊ฐ๋งํจ์๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋ฉ๋๋ค.
$$\Gamma(\alpha) = \int^{\infty}_{0}x^{\alpha -1} \cdot e^{-x} \; dx$$
์์ฑ
๋ง์ฝ α > 1์ด๋ผ๋ฉด,
$$\Gamma(\alpha) = (\alpha -1) \; \Gamma(\alpha -1)$$
์ฆ๋ช
๋ถ๋ถ ์ ๋ถ์ ์ด์ฉํฉ๋๋ค.
$$u = -e^{-x}, \;\; dv = (\alpha-1)x^{\alpha -2}$$
$$\Gamma(\alpha) \; = \; [-e^{-x} \cdot x^{\alpha-1}]^{\infty}_{0} \;+ \; \int^{\infty}_{0}(\alpha-1)\cdot x^{\alpha-2} \cdot e^{-x}\;dx $$
$$= (\alpha-1) \int^{\infty}_{0}x^{\alpha-2} \cdot e^{-x}\;dx $$
$$= (\alpha -1 )\Gamma(\alpha-1)$$
๋ํ α๊ฐ 1๋ณด๋ค ํฐ ์ ์์ธ ๊ฒฝ์ฐ
$$\Gamma(1) = 1$$
$$\Gamma(\alpha) = (\alpha-1)!$$
์นด์ด์ ๊ณฑ ๋ถํฌ์ ์์ฑ
ํ๊ท ๊ณผ ๋ถ์ฐ
์์ ๋ m์ ๊ฐ์ง ์นด์ด์ ๊ณฑ ๋ถํฌ๋ฅผ ๋ฐ๋ฅด๋ ํ๋ฅ ๋ณ์ X์ ํ๊ท ๊ณผ ๋ถ์ฐ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$E(X) = m, \;\;\; Var(X) = 2m$$
ํ๋ฅ ๋ณ์๋ค์ ํฉ
์นด์ด์ ๊ณฑ ๋ถํฌ๋ฅผ ๋ฐ๋ฅด๋ n๊ฐ์ ๋ ๋ฆฝ์ ์ธ ํ๋ฅ ๋ณ์๋ค์ ๋ํ์ฌ ๋ค์์ด ์ฑ๋ฆฝํฉ๋๋ค.
$$X_1, ..., X_n\;\;\;\;\;\; X_i \;\sim \; \chi^{2}(m_i) $$
$$X_1 + X_2 + ... + X_n \; \sim \;\; \chi^{2}(m_1+ m_2 + ... + m_n)$$
ํ์ค ์ ๊ท๋ถํฌ์์ ์ฐ๊ด์ฑ
๋ค์๊ณผ ๊ฐ์ ํ๋ฅ ๋ณ์ X์ Y์ ๋ํด
$$X \; \sim \; N(0, 1^{2})\;\;\;\;\;\;\;\;Y = X^{2}$$
๋ค์์ด ์ฑ๋ฆฝํฉ๋๋ค.
$$Y \; \sim \; \chi^{2}(1)$$
์ฆ๋ช
f(y), F(y)๋ฅผ ๊ฐ๊ฐ ํ๋ฅ ๋ณ์ Y์ ๋ํ p.d.f, c.d.f๋ผ ๊ฐ์ ํ๊ฒ ์ต๋๋ค.
๋ํ X๋ ํ์ค ์ ๊ท๋ถํฌ(SND)๋ฅผ ๋ฐ๋ฅด๋ฏ๋ก,
$$F(y) = P(Y \leq y) = P(X^{2} \leq y) = P(-y^{\frac{1}{2}} \leq X \leq y^{\frac{1}{2}} )$$
$$=\Phi(y^{\frac{1}{2}}) - \Phi(-y^{\frac{1}{2}})$$
์ด๋ f(y) = F'(y)์ด๋ฏ๋ก
$$f(y) = \phi(y^{\frac{1}{2}})(\frac{1}{2}y^{-\frac{1}{2}}) + \phi(-y^{\frac{1}{2}})(\frac{1}{2}y^{-\frac{1}{2}})$$
SND์ p.d.f์ ๊ฐ์ ์ฌ์ฉํ์ฌ ์ ๋ฆฌํ๋ฉด
$$f(y) = y^{-\frac{1}{2}} \frac{1}{(2\pi)^{\frac{1}{2}}} e^{-\frac{y}{2}} \;\;\;\;\;\; for \; y >0 \;\;\; \because \; \phi(y^{\frac{1}{2}}) = \phi(-y^{\frac{1}{2}})$$
์ด๋ 1/2์ ๋ํ ๊ฐ๋งํจ์์ ๊ฐ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$\Gamma(\frac{1}{2}) = \sqrt{\pi}$$
์ฆ ์ ์์ ์์ ๋๊ฐ 1์ธ ์นด์ด์ ๊ณฑ ๋ถํฌ์ p.d.f์ ๋์ผํฉ๋๋ค.
$$f(\;x\;|\;m\;) = \frac{1}{2^{\frac{m}{2} \cdot \Gamma(\frac{m}{2})}} \cdot x^{(\frac{m}{2})-1}\cdot e^{-\frac{x}{2}} $$
$$f(\;x\;|\;1\;) = \frac{1}{2^{\frac{1}{2} \cdot \Gamma(\frac{1}{2})}} \cdot x^{(\frac{1}{2})-1}\cdot e^{-\frac{x}{2}} $$
$$= \frac{1}{\sqrt{2\pi}} \cdot x^{(-\frac{1}{2})}\cdot e^{-\frac{x}{2}} $$
ํ์ค ์ ๊ท๋ถํฌ์ ์นด์ด์ ๊ณฑ๋ถํฌ
๋ฐ๋ก ์์์ ์ดํด๋ณธ ์์ฑ์ ์ฌ์ฉํ์ฌ, ์นด์ด์ ๊ณฑ๋ถํฌ๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ์ ์ํ ์ ์์ต๋๋ค.
์นด์ด์ ๊ณฑ ๋ถํฌ๋ k๊ฐ์ ์๋ก ๋ ๋ฆฝ์ ์ธ ํ์ค ์ ๊ท๋ถํฌ๋ฅผ ๋ฐ๋ฅด๋ ํ๋ฅ ๋ณ์๋ฅผ ๊ฐ๊ฐ ์ ๊ณฑํ ๋ค์ ํฉํด์ ์ป์ด์ง๋ ๋ถํฌ์ ๋๋ค.
์ด ๋ k๋ฅผ ์์ ๋๋ผ๊ณ ํ๋ฉฐ, ์นด์ด์ ๊ณฑ ๋ถํฌ์ ๋งค๊ฐ๋ณ์๊ฐ ๋ฉ๋๋ค.
์ฆ SND๋ฅผ ๋ฐ๋ฅด๋ ๋ถํฌ๋ก๋ถํฐ ์์์ถ์ถํ n๊ฐ์ ํ๋ณธ๋ค์ ๋ํ์ฌ, ํด๋น ํ๋ณธ๋ค์ X1, X2, ...., Xn์ด๋ผ ํ ๋,
$$X_1^{2} + X_2^{2} + ... + X_n^{2} \; \sim \; \chi^{2}(n)$$
์์
์์ ์์๋ฅผ ํตํด ๋ค์์ ์ฆ๋ช ํ์์ต๋๋ค.
์๋ ค์ง ํ๊ท ๊ณผ, ์๋ ค์ง์ง ์์ ๋ถ์ฐ์ ๋ํ์ฌ, ์ ๊ท๋ถํฌ๋ฅผ ๋ฐ๋ฅด๋ ๋ชจ์ง๋จ์์ ๋ ๋ฆฝ์ ์ผ๋ก n๊ฐ์ ํ๋ณธ์ ์ถ์ถํ์์ ๋,
๋ถ์ฐ์ ๋ํ MLE๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$\hat{\sigma^{2}_o} = \frac{\sum^{n}_{i=1}(X_i - \mu)^{2}}{n}$$
๊ทธ๋ฆฌ๊ณ ์ด์ ํ๋ณธ์ ์ n์ ๊ณฑํ๊ณ , ์ด๋ฅผ ๋ชจ๋ถ์ฐ์ผ๋ก ๋๋ ์ค ๊ฐ์, ์์ ๋ n์ ๊ฐ์ง ์นด์ด์ ๊ณฑ ๋ถํฌ๋ฅผ ๋ฐ๋ฆ ๋๋ค.
$$\frac{n\hat{\sigma^{2}_o}}{\sigma^{2}} \; \sim \; \chi^{2}(n)$$
์ฆ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$\frac{\sum^{n}_{i=1}(X_i - \mu)^{2}}{\sigma^{2}} \; \sim \; \chi^{2}(n)$$
์์ ๋ (degree of freedom)
์์ ๋๋ ํต๊ณ๋์ ์ถ์ ํ ๋ ์ฌ์ฉ๋๋ ๋ฐ์ดํฐ์ ์ ๋ณด๋์ ์๋ฏธํฉ๋๋ค.
๊ฐ๋จํ๊ฒ๋ ๋ ๋ฆฝ๋ณ์์ ๊ฐ์๋ผ ์๊ฐํ์ค ์ ์์ต๋๋ค.
์๋ฅผ ๋ค์ด A+B+C = 5๋ผ๋ ์์์, ๋ ๋ฆฝ๋ณ์์ ๊ฐ์๋ 2๊ฐ์ ๋๋ค.
A์ B๊ฐ ์ ํด์ง ๊ฒฝ์ฐ, C๋ ๊ณ ์ ๋ ๊ฐ์ ๊ฐ์ ธ์ผ ํ๊ธฐ ๋๋ฌธ์ ๋๋ค.
์ฆ ์ด๋ฌํ ๊ฒฝ์ฐ ์์ ๋๋ 2๊ฐ ๋ฉ๋๋ค.
Reference
https://www.youtube.com/watch?v=faVIwae-wkw&t=5s