Biased(ํธ์)
ํธ์๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋ฉ๋๋ค.
ํธ์ = ์ถ์ ๋์ ๊ธฐ๋๊ฐ - ๋ชจ์
์๋ฅผ ๋ค์ด ๋ํ์ ์ธ ์ถ์ ๋์ธ ํ๋ณธํ๊ท ์ ๋ํ ํธ์๋ฅผ ๊ตฌํด๋ณด๊ฒ ์ต๋๋ค.
ํ๋ณธํ๊ท ์ ๊ธฐ๋๊ฐ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
ํ๋ณธํ๊ท ์ ๋ค์๊ณผ ๊ฐ์ผ๋ฏ๋ก
$$\overline{X_n} = \frac{1}{n}\sum^{n}_{i=1}X_i$$
ํ๋ณธํ๊ท ์ ํ๊ท ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$E(\overline{X_n})=\frac{1}{n}\cdot E(X_1+X_2+\cdots +X_n) $$
$$=\frac{1}{n}\cdot (E(X_1)+E(X_2)+\cdots +E(X_n ))$$
$$=\frac{1}{n}\cdot n \cdot E(X_1)$$
$$= \frac{1}{n} \cdot n \cdot \mu = \mu $$
์ฆ ํ๋ณธํ๊ท (์ถ์ ๋)๊ณผ ๋ชจํ๊ท (๋ชจ์)๊ฐ ๋์ผํ๋ฏ๋ก ํธ์๊ฐ 0์ ๋๋ค.
์ด๋ฌํ ๊ฒฝ์ฐ(ํธ์ = 0), ์ถ์ ๋์ ํธ์๊ฐ ์๋ ์ถ์ ๋ ์ฆ, ๋ถํธ์ถ์ ๋์ด๋ผ ๋ถ๋ฆ ๋๋ค.
์ข์ ์ถ์ ๋์ ๋ํ์ฌ
์๋ ค์ง์ง ์์ ๋ชจ์ $\theta$๋ฅผ ๊ฐ์ง ๋ถํฌ๋ก๋ถํฐ ์ถ์ถํ n๊ฐ์ ํ๋ณธ๋ค $X_1, ..., X_n$๊ฐ ์ฃผ์ด์ก์ ๋(๊ด์ฐฐ๋์์ ๋),
๋ชจ์๋ฅผ ์ถ์ ํ๊ธฐ ์ํ ์ถ์ ๋์ ๋ค์๊ณผ ๊ฐ์ด ์ ์ํฉ๋๋ค.
$\delta(x_1, ..., x_n) $ : $g(\theta)$ ์ ๋ํ ์ถ์ ๋(estimator)
(์ด๋, ๊ฐ๋ฅ๋ ํจ์์ ๊ฐ์ ์ต๋๋ก ๋ง๋๋ ์ถ์ ๋( $\delta$ )์ ์ต๋๊ฐ๋ฅ๋์ถ์ ๋(M.L.E)์ด๋ผ ๋ถ๋ฆ ๋๋ค.)
M.L.E ์ธ์๋ ๋ง์ ์ถ์ ๋์ด ์์ผ๋ฉฐ, ์ด๋ฌํ ์ถ์ ๋ ์ค ์ข์ ์ถ์ ๋์ ์ฌ์ฉํ ์๋ก ๋ชจ์ง๋จ์ ๋ํ ์ถ์ ์ ๋์ฑ ์ ํ ์ ์์ ๊ฒ์ ๋๋ค.
$g(\theta)$ ์ ๋ ๋ฆฝ์ ์ผ๋ก($g(\theta)$์ ์๊ด์์ด), ์ถ์ ๋($\delta$)์ ๊ฒฐ๊ณผ๊ฐ(์ถ์ ๊ฐ, estimate)์ด $g(\theta)$์ ๊ฐ๊น์ธ ํ๋ฅ ์ด ๋์ ์ถ์ ๋์ ์ข์ ์ถ์ ๋์ด๋ผ ํฉ๋๋ค.
์ด๋ '$g(\theta)$์ ๊ฐ๊น๋ค'๋ฅผ ์ ์ํ๊ธฐ ์ํด ๊ธฐ๋๊ฐ(expectation)์ ์ฌ์ฉํฉ๋๋ค.
์๋ฅผ ๋ค์ด๋ณด๊ฒ ์ต๋๋ค.
์ ๊ท๋ถํฌ N($\mu$, 1)์ ๋ฐ๋ฅด๋ ๋ชจ์ง๋จ์ผ๋ก๋ถํฐ ์ถ์ถํ n๊ฐ์ ํ๋ณธ๋ค์ ๋ํ ๋ฒกํฐ๋ฅผ X=($X_1$, ..., $X_n$)์ด๋ผ ์ ์ํ์์ ๋,
$\mu$์ ๋ํ M.L.E๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$MLE \; of\; \mu = \; \overline{X}_n$$
์ด๋ ํ๋ณธํ๊ท ์ ๋ค์๊ณผ ๊ฐ์ ๋ถํฌ๋ฅผ ๋ฐ๋ฆ ๋๋ค.
$$\overline{X}_n \; \sim \; N(\mu, \frac{1}{n})$$
์ฆ ํ๋ณธํ๊ท ์ ํ๊ท ์ ๋ชจํ๊ท ๊ณผ ๊ฐ์ผ๋ฏ๋ก, ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$E(\overline{X}_n) = \mu$$
๋ถํธ์ถ์ ๋(Unbiased estimator)
์ถ์ ๋ $\delta(X)$ ๊ฐ ์๋๋ฅผ ๋ง์กฑํ ๊ฒฝ์ฐ์๋ง $\delta$ ๋ฅผ ๋ถํธ์ถ์ ๋(Unbiased estimator)์ด๋ผ ๋ถ๋ฆ ๋๋ค.
$$E_{\theta}(\delta(X)) = g(\theta)$$
์๋ฅผ ๋ง์กฑํ์ง ์๋ ๊ฒฝ์ฐ, $\delta$ ๋ฅผ ํธ์ ์ถ์ ๋(Bias of an estimator)์ด๋ผ ๋ถ๋ฆ ๋๋ค.
ํธํฅ(Bias)์ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋ฉ๋๋ค.
$$E_{\theta}(\delta(X)) - g(\theta)$$
์๋ฅผ ๋ค์ด ํ๋ณธํ๊ท ์ ํ๊ท (๊ธฐ๋๊ฐ)์ ๋ชจํ๊ท ๊ณผ ๊ฐ์ผ๋ฏ๋ก, ํ๋ณธํ๊ท ์ ๋ถํธ์ถ์ ๋์ ๋๋ค.
ํ๋ณธ๋ถ์ฐ์ n-1๋ก ๋๋๋ ์ด์
๋๋ถ๋ถ์ ์ฑ ๋ค์ด๋ ์ธํฐ๋ท์์, ํ๋ณธ๋ถ์ฐ์ ๊ตฌํ ๋ ํ๋ณธํ๊ท ๊ณผ ๋ค๋ฅด๊ฒ n์ด ์๋ n-1๋ก ๋๋์ด์ ๊ตฌํฉ๋๋ค.
์ฌ์ค n์ผ๋ก ๋๋๋ ๊ฒ์ด ๋ง์ง๋ง, n-1๋ก ๋๋๋ ์ด์ ๋ ํ๋ณธ๋ถ์ฐ์ ๋ถํธ์ถ์ ๋์ผ๋ก ๋ง๋ค๊ธฐ ์ํจ์ ๋๋ค.
์ฆ ํ๋ณธ๋ถ์ฐ์ ๊ตฌํ ๋ n์ผ๋ก ๋๋๋ค๋ฉด, ํ๋ณธ๋ถ์ฐ์ ๊ธฐ๋๊ฐ์ ๋ชจ๋ถ์ฐ๊ณผ ๋ค๋ฅด๊ฒ ๋์ต๋๋ค.
๊ทธ๋ฌ๋ n-1๋ก ๋๋๋ค๋ฉด, ํ๋ณธ๋ถ์ฐ์ ๊ธฐ๋๊ฐ์ด ๋ชจ๋ถ์ฐ๊ณผ ์ ํํ ์ผ์นํฉ๋๋ค.
์ด์ ๋ถํฐ ์ด์ ๋ํ ์ฆ๋ช ์ ํด๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
๋ถ์ฐ์ ๋ํ ๋ถํธ์ถ์ ๋
๋ชจ์ $\theta$ ์ ์์กด์ ์ธ ์ด๋ ํ ๋ถํฌ๋ก๋ถํฐ ์์์ถ์ถํ n๊ฐ์ ํ๋ณธ๋ค์ ๋ํ์ฌ,
ํด๋น ๋ถ์ฐ์ ์ ํ(finite)ํ๋ค๊ณ ๊ฐ์ ํ๊ฒ ์ต๋๋ค.
๊ทธ๋ฆฌ๊ณ $g(\theta)$๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ์ ์ํฉ๋๋ค
$$g(\theta) = Var_{\theta}(X_1)$$
๋ค์์ ๋ถ์ฐ$g(\theta)$ ์ ๋ถํธ์ถ์ ๋์ ๋๋ค.
$$\hat{\sigma_{1}^{2}} = \frac{1}{n-1}\sum^{n}_{i=1}(X_1 - \overline{X}_n)^{2}$$
์ด์ ๋ํ ์ฆ๋ช ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
๋ค์๊ณผ ๊ฐ์ด ์ ์ํ๊ฒ ์ต๋๋ค.
$$E_{\theta}(X_1) = \mu $$
$$\sigma^{2} = g(\theta) = Var_{theta}(X_1)$$
์ด๋ ํ๋ณธํ๊ท ์ ๋ชจํ๊ท ($\mu$ )์ ๋ํ ๋ถํธ์ถ์ ๋์ ๋๋ค.
ํ๋ณธ๋ถ์ฐ๋ ํ๋ณธํ๊ท ๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก, ๋ค์์ฒ๋ผ ์ ์ํ๋ ๊ฒ์ด ์์ฐ์ค๋ฝ์ต๋๋ค.
$$\hat{\sigma^{2}} = \frac{\sum^{n}_{i=1}(X_i - \overline{X}_n)^{2}}{n}$$
์ด์ ์ด๋ ๊ฒ ์ ์๋ ํ๋ณธ๋ถ์ฐ์ด ๋ถํธ์ถ์ ๋์ธ์ง ํ์ธํด ๋ณด๊ฒ ์ต๋๋ค.
์ฐ์ ๊ณ์ฐ์ ํธํ๊ฒ ํ๊ธฐ ์ํด ๋ค์์ ๋ฑ์์ ์ฆ๋ช ํ๊ฒ ์ต๋๋ค.
$$\sum^{n}_{i=1}(X_i - \mu)^{2} = \sum^{n}_{i=1}(X_i - \overline{X_n})^{2} + n(\overline{X_n} - \mu)^{2}$$
$$\sum^{n}_{i=1}(X_i - \mu)^{2} = \sum^{n}_{i=1}(X_i - \overline{X_n} - \mu + \overline{X_n} )^{2}$$
$$ =\sum^{n}_{i=1}(X_i - \overline{X_n})^{2} + \sum^{n}_{i=1}(\overline{X_n} - \mu)^{2}$$
$$ =\sum^{n}_{i=1}(X_i - \overline{X_n})^{2} + n(\overline{X_n} - \mu)^{2}$$
์ด์ ์ด๋ฅผ ์ฌ์ฉํ์ฌ ์ฆ๋ช ํ๋๋ก ํ๊ฒ ์ต๋๋ค.
์์