ํต๊ณ์ ๋ชฉ์
๊ฒฐ๊ตญ ์ ํฌ๊ฐ ํต๊ณ๋ฅผ ํตํด ์ป๊ณ ์ ํ๋ ๊ฒ์ ๋ค์๊ณผ ๊ฐ์ ๊ฒ๋ค์ผ ๊ฒ์ ๋๋ค.
"ํ๋ณธ๋ค์ด ์ด๋ฌ์ผ๋ ๋ชจ์ง๋จ์ ํ๊ท ์ ์ผ๋ง์ผ๊ฑฐ์ผ!"
"์ค๊ฐ ๋ชจ์ง๋จ์ ํ๊ท ์ด A์ผ๊ฑฐ๋ผ ์ฃผ์ฅํ๋๋ฐ ํ๋ณธ์ ๋ณด๋ A์ผ์๊ฐ ์๊ฒ ๋๊ฑธ?"
์ฒซ๋ฒ์งธ ๊ฒฝ์ฐ๋ ๋ชจ์์ ๋ํ "์ถ์ "์ ํ๋ ๊ฒ์ด๊ณ
๋๋ฒ์งธ ๊ฒฝ์ฐ๋ ๊ฐ์ค์ ๋ํ "๊ฒ์ "์ ํ๋ ๊ฒ์ ๋๋ค.
์ด๋ค ์ํฉ์ด๋ , ์ ํฌ๋ ๋ชจ์ง๋จ์ ์ ์์กฐ์ฌ ํ ์ ์์ด์ ํ๋ณธ๋ค์ ์กฐ์ฌํฉ๋๋ค.
์กฐ์ฌํ ํ๋ณธ๋ค์ ํตํด ํต๊ณ๋ฅผ ๋ด๊ณ , ์ด๋ฅผ ํตํด ๋ชจ์ง๋จ์ ์ถ์ , ํน์ ๊ฒ์ ์ ์งํํฉ๋๋ค.
์์ผ๋ก ๋ฐฐ์ธ ๋ด์ฉ์ ํ๋ณธ๋ค์ ์ถ์ถํ์ฌ ํต๊ณ๋ฅผ ๋ด์์ ๋ ๊ทธ๋ ค์ง๋ ๋ถํฌ์ ์ด๋ค์ ์์ฑ์ ๋ฐฐ์ธ ๊ฒ์ ๋๋ค.
์ด์ ์ ๋ฐฐ์ด ์ค์ฌ๊ทนํ์ ๋ฆฌ๋ ํ๋ณธ์ ์๊ฐ ์ปค์ง๋ฉด ํ๋ณธํ๊ท ์ ์ ๊ท๋ถํฌ์ ์๋ ดํ๋ค๋ ๋ด์ฉ์ด์๊ณ ,
M.L.E ๋ ๊ด์ฐฐ๋ ํ๋ฅ ๋ณ์๋ค, ์ฆ ์กฐ์ฌ๋ ํ๋ณธ๋ค์ ํตํด ๋ชจ์๊ฐ ์ด๋ ํ ๊ฐ์ ๊ฐ์ง ํ๋ฅ ์ด ๊ฐ์ฅ ๋์์ง์ ๋ํ ๋ด์ฉ์ด์์ต๋๋ค.
์ค์ฌ๊ทนํ์ ๋ฆฌ์ ์ํด ํ๋ณธํ๊ท ์ ํ๊ท ์ ๋ชจํ๊ท ์ ์๋ ดํ๊ณ ,
M.L.E์ ์ํด ํ๋ณธ๋ค์ด ์ถ์ถ๋์์ ๋, ํด๋น ํ๋ณธ๋ค์ ํ๊ท ์ด ๋ชจํ๊ท ์ผ ๊ฐ๋ฅ์ฑ์ด ๊ฐ์ฅ ์ปธ์ต๋๋ค.
์์์ ํ๋ณธํ๊ท ์ด๋ผ๋ ๋จ์ด๊ฐ ์ ๋ง ๋ง์ด ๋ฑ์ฅํ์ต๋๋ค.
ํ๋ณธํ๊ท ์ ๊ฒฐ๊ตญ ํ๋ณธ๋ค์ ์ถ์ถํ์ฌ ์ป์ ์ ์๋ ๊ฐ์ฅ ๋ํ์ ์ธ ํต๊ณ๋์ผ๋ก, ์ด๋ฅผ ํตํด ๋ชจํ๊ท ๊ณผ ๋ชจ๋ถ์ฐ์ ์ถ์ ํ๋ ๋ฐ ์ฌ์ฉ๋ ์ ์์ต๋๋ค.
์์ผ๋ก ์งํ๋ ๋ด์ฉ๋ค์ ์์, ๊ฒฐ๊ตญ ์ฐ๋ฆฌ์ ์ต์ข ๋ชฉ์ ์ ํ๋ณธ์ ํตํ ๋ชจ์์ ์ถ์ ํน์, ๊ฒ์ ์ ํ๋ ๊ฒ์ด๋ผ๋ ๊ฒ์ ํ๋ฒ ์๊ธฐํ๊ณ ์งํํ๊ฒ ์ต๋๋ค.
๋ชจ์์ ํต๊ณ๋
๋ชจ์(parameter) - ํต๊ณ์ ์ถ๋ก ์์ ๋ถ์ํ๊ณ ์ ํ๋ ์ต์ข ๋ชฉํ์ธ ๋ชจ์ง๋จ(population)์ ํน์ฑ
ํต๊ณ๋(statistic) - ๋ชจ์ง๋จ์์ ์ถ์ถํ ํ๋ณธ(random sample)์ ์ด์ฉํด ๋ง๋ ๊ฒ์ผ๋ก ํ๋ณธ๋ค์ ํจ์
ํต๊ณ์ ๊ฒ์ ์ ์ํด ํน์ํ ํต๊ณ๋์ ์ฌ์ฉํ๊ธฐ๋ ํ๊ณ , ๋ชจ์๋ฅผ ์ถ์ ํ๊ธฐ ์ํด ํต๊ณ๋์ ๊ตฌํด๋ณด๊ธฐ๋ ํฉ๋๋ค.
์ ์์ ๊ฒฝ์ฐ ๊ฒ์ ํต๊ณ๋(test statistic), ํ์์ ๊ฒฝ์ฐ ์ถ์ ๋(estimator)์ด๋ผ๊ณ ํฉ๋๋ค.
์ด์ ๊ธ์์ ๋ค๋ฃจ์๋ ์ต๋์ฐ๋๋ฒ(Maximun Likehood Estimator)์ด ๋ฐ๋ก ๋ชจ์์ ๋ํ ํต๊ณ๋, ์ฆ ์ถ์ ๋์ ๊ตฌํ ๊ฒ์ ๋๋ค.
ํต๊ณ๋์ ๊ผญ ํ๋ณธํ๊ท , ํ๋ณธ๋ถ์ฐ๊ณผ ๊ฐ์ด ๋ชจ์๋ฅผ ์ถ์ ํ๋ ๊ฒ๋ค๋ง์ด ์๋๋๋ค.
ํ๋ณธ๋ค๋ก๋ง ์ด๋ฃจ์ด์ง ํจ์๋ ์ ๋ถ ๋ค ํต๊ณ๋์ ๋๋ค.
๋ค๋ง ์ด์ค์์ ํ๋ณธํ๊ท ๊ณผ ํ๋ณธ๋ถ์ฐ์ด ๋งค์ฐ ์์ฃผ ์ฌ์ฉ๋๋ ํต๊ณ๋์ ๋๋ค.
ํต๊ณ๋์ ์ ์
๊ด์ฐฐ ๊ฐ๋ฅํ n๊ฐ์ ํ๋ฅ ๋ณ์ X1, ..., Xn์ด ์๋ค๊ณ ๊ฐ์ ํ์์ ๋,
r์ n๊ฐ์ ์ค์ ๋ณ์์ ๋ํ ์์์ ์คํจ์(real-valued function : ํจ์๊ฐ์ด ์ค์๋ผ๋ ๋ป)๋ผ ํ๋ฉด,
์ด๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋ ํ๋ฅ ๋ณ์ T๋ฅผ ํต๊ณ๋(statistic)์ด๋ผ ํฉ๋๋ค.
$$T = r(X_1, ..., X_n)$$
์ด๋ ค์ด ๋จ์ด๋ผ ์๊ฐํ์ง ๋ง์๊ณ , ์ฐ๋ฆฌ๊ฐ ๋ชจ์ง๋จ์ ์กฐ์ฌํ๊ธฐ ์ํด ํ๋ณธ๋ค์ ์กฐ์ฌํ์ฌ ํต๊ณ์น๋ฅผ ๋ธ ๊ทธ ๋ชจ๋ ๊ฒ๋ค์ด ํต๊ณ๋์ ๋๋ค.
์๋ฅผ ๋ค์ด
ํ๋ณธ๋ค์ ์กฐ์ฌํ๋ ํ๊ท ์ด A๋๋ผ -> ํต๊ณ๋
ํ๋ณธ๋ค์ ์กฐ์ฌํ๋ ๋ถ์ฐ์ด B๋๋ผ -> ํต๊ณ๋
๊ฐ ํ๋ณธ๋ค์ 10์ ๋ํ๊ณ 2๋ก ๋๋๊ณ ๋ญ ํ๊ณ ๋ญ ํ๋ ๋ญ๋๋ผ -> ํต๊ณ๋
ํ๋ณธ๋ถํฌ
ํ๋ณธ๋ถํฌ๋ ์ฝ๊ฒ ๋งํ๋ฉด ํต๊ณ๋์ ๋ํ ๋ถํฌ์ ๋๋ค.
์ฐ๋ฆฌ๊ฐ ๋ชจ์ง๋จ์ ๋ํด์ n๊ฐ์ ํ๋ณธ๋ค์ ๋ฝ์ ์กฐ์ฌํ ๋ ๋๋ถ๋ถ์ ๊ฒฝ์ฐ ํด๋น ์กฐ์ฌ์ ๋จ ํ๋ฒ๋ง ์งํํ์ง๋ ์์ต๋๋ค.
์ฌ๋ฌ๋ฒ ๊ฐ์ ์์ ํ๋ณธ๋ค์ ๋ฝ์ ์กฐ์ฌํ ํ, ๊ฐ๊ฐ ์กฐ์ฌ์ ๋ํ ํต๊ณ์น๋ค์ ์ฌ์ฉํ์ฌ, ํด๋น ํต๊ณ์น๋ค์ ํ๊ท ์ ๊ตฌํ๊ณ ์ด๋ฅผ ํตํด ๋ชจ์ง๋จ์ ์ถ์ธกํฉ๋๋ค.
์กฐ๊ธ ๋ ์ฝ๊ฒ ์ดํดํ๊ธฐ ์ํด, ์ ๊ตญ ์ด๋ฑํ์๋ค์ IQ์ ํ๊ท ์ ๊ตฌํด์ผ ํ๋ค๋ ์ํฉ์ ์ง๋ฉดํ๋ค๊ณ ์๊ฐํด๋ณด๊ฒ ์ต๋๋ค.
๋งจ ์ฒ์ 100๋ช ์ ํ์๋ค์ ๋ฝ์ ํ๊ท ์ ๋ด์๋๋ 130์ด์์ต๋๋ค.
๊ทธ๋ ๋ค๋ฉด ์ ํฌ๋ ์ ์ ๊ตญ ์ด๋ฑํ์๋ค์ IQ์ ํ๊ท ์ 130์ผ๊ฑฐ์ผ! ๋ผ๊ณ ํ๋จํ๋์?
์๋๋๋ค. ์ด๋ฌํ ํ๋ณธ๋ค์ ๋ฝ์ ์กฐ์ฌํ๋ ๊ณผ์ ์ ์ฌ๋ฌ๋ฒ ๊ฑฐ์น ํ, ํด๋น ํ๋ณธ๋ค์ ํ๊ท ์ ํตํด ์ ๊ตญ ์ด๋ฑํ์๋ค์ IQ์ ๋ํ ํ๊ท ์ ๋ผ ๊ฒ์ ๋๋ค.
์ฝ๊ฒ ๋งํด 100๋ช ์ ํ์๋ค์ ์กฐ์ฌํ๋ ์์ ์ 50๋ฒ ์งํํ๋๋, ํด๋น ํ๋ณธ๋ค์ ํ๊ท ์ ํ๊ท ์ด 100์ด์๋ค๊ณ ๊ฐ์ ํ๊ฒ ์ต๋๋ค.
์ด์ ์ฐ๋ฆฌ๋ ์ ๊ตญ ์ด๋ฑํ์๋ค์ IQ๋ ํ๊ท ์ ์ผ๋ก 100์ผ๊ฑฐ์ผ ๋ผ๋ ํ๋จ์ ๋ด๋ฆด ์ ์์ต๋๋ค.
์ ๊ณผ์ ์์ ํ๋ณธ๋ค์ ํ๊ท ์ ํ๊ท , ์ฆ ํ๋ณธํ๊ท ์ ํ๊ท ์ ์ฌ์ฉํ์ต๋๋ค.
์งํํ 50๋ฒ์ ์กฐ์ฌ์์ ํ๋ณธํ๊ท ๋ค์ ํ๊ท ์ ๊ทธ๋ํ ์์ ํ์ํ ์ ์์ ๊ฒ์ ๋๋ค.
์ด๊ฒ์ด ๋ฐ๋ก ํ๋ณธํ๊ท ์ ๋ถํฌ, ์ฆ ํต๊ณ๋์ ๋ํ ๋ถํฌ์ ํ ์์๊ฐ ๋๋ ๊ฒ์ ๋๋ค.
ํ๋ณธ๋ถํฌ์ ์ ์
ํ๋ฅ ๋ณ์ X = (X1, ..., Xn)์ด ๊ฐ์ ๋ชจ๋ฅด๋ ๋ชจ์ ฮธ๋ฅผ ๊ฐ์ง ๋ถํฌ์์ ์์๋ก ์ถ์ถ๋ n๊ฐ์ ํ๋ณธ๋ค์ด๋ผ ๊ฐ์ ํ๊ณ ,
T๋ฅผ X์ ๋ชจ์ ฮธ์ ๋ํ ํจ์๋ผ ํ๊ฒ ์ต๋๋ค. ์ฆ T(X1, X2, ..., Xn, ฮธ) ์ ๋๋ค.
ฮธ๊ฐ ์ฃผ์ด์ก์ ๋, T์ ๋ถํฌ๋ฅผ T์ ๋ํ ํ๋ณธ ๋ถํฌ(Sampling Distribution)๋ผ ํฉ๋๋ค.
ํ๋ณธ ๋ถํฌ๋ผ๋ ์ด๋ฆ์ T๊ฐ ๋ฌด์์ ํ๋ณธ(random sample)์ ์์กดํ๊ณ , ๋ฐ๋ผ์ T์ ๋ถํฌ ์ญ์ ํ๋ณธ์ผ๋ก๋ถํฐ ์ ๋๋๋ค๋ ์ฌ์ค๋ก๋ถํฐ ๋น๋กฏ๋ ์ด๋ฆ์ ๋๋ค.
๊ทธ๋ฆฌ๊ณ (T์ ๋ํ) ํ๋ณธ ๋ถํฌ๋ก๋ถํฐ ๊ณ์ฐ๋ T์ ํ๊ท ์ ๋ค์๊ณผ ๊ฐ์ด ๋ํ๋ด๊ฒ ์ต๋๋ค.
$$E_\theta(T)$$
์ข ์ข ํ๋ฅ ๋ณ์ T๋ ๋ชจ์ ฮธ์ ๋ํด ์์กด์ ์ด์ง ์์ต๋๋ค. (์ด ๊ฒฝ์ฐ T๋ ํต๊ณ๋(statistic)์ด๋ผ ๋ถ๋ฆฝ๋๋ค)
ํนํ T๊ฐ ๋ชจ์ ฮธ์ ๋ํ ์ถ์ ๋(estimator)์ธ ๊ฒฝ์ฐ์๋ T๋ X์ ๋ํ ํจ์์ด๋ฏ๋ก ํต๊ณ๋(statistic)์ ๋๋ค.
๋ฐ๋ผ์, ์์น์ ์ผ๋ก๋ ๊ฐ๊ฐ์ ๋ชจ์์ ๋ํ ์ถ์ ๋(estimator)์ ํ๋ณธ ๋ถํฌ๋ฅผ ์ ๋ํ๋ ๊ฒ์ด ๊ฐ๋ฅํฉ๋๋ค.
ํ๋ณธ ํ๊ท ์ ๋ถํฌ
์๊น ํ์๋ค์ IQ ์์์์ ์ดํด๋ณด์๋ฏ์ด, ํ๋ณธํ๊ท ์ ๋ถํฌ๋ ํ๋ณธ ๋ถํฌ์ ๋ํ์ ์ธ ์์์ ๋๋ค.
์ ํฌ๋ ์ง๊ธ๊น์ง ํ๋ณธํ๊ท ์ ์ฌ๋ฌ๊ฐ์ง ์์ฑ๋ค๊ณผ ์ค์ฌ๊ทนํ์ ๋ฆฌ(Central Limit Theorem, CLT)์ ๋ํด ์์๋ณด์์ต๋๋ค.
์ฆ ํ๋ณธ ํ๊ท ์ ๋ถํฌ์ ๋ํ ์ฌ๋ฌ ์์ฑ๋ค์ ์์๋ณธ ๊ฒ์ด๋ฉฐ, ํ๋ฒ ์ ๋ฆฌํ๊ณ ๋์ด๊ฐ๊ฒ ์ต๋๋ค.
$$1. \;\;E(\overline{X_n}) = \mu, \;\;\; V(\overline{X_n}) = \frac{\sigma^{2}}{n} $$
2. ๋ชจ์ง๋จ์ ๋ถํฌ์ ์๊ด์์ด, n์ด ์ถฉ๋ถํ ํฌ๋ค๋ฉด ๋ค์์ด ๊ทผ์ฌ์ ์ผ๋ก ์ฑ๋ฆฝํฉ๋๋ค. (์ค์ฌ๊ทนํ์ ๋ฆฌ, CLT)
$$\;\; \overline{X_n} \; \sim \; N(\;\mu,\; \frac{\sigma^{2}}{n}\;) $$
์ด์ ๋ถํฐ ์ ๊ท๋ถํฌ์ ๋ฌด์์ ํ๋ณธ(random sample)์ ๋ํด ํ๋ณธ ๋ถ์ฐ์ ๋ถํฌ์, ํ๋ณธ ํ๊ท ๋ฐ ํ๋ณธ ๋ถ์ฐ์ ๋ค์ํ ํจ์์ ๋ํ ๋ถํฌ๋ฅผ ๋์ถํด ๋ณด๊ฒ ์ต๋๋ค.
'๐ฅ Computer Science > ํ๋ฅ ๊ณผ ํต๊ณ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
ํต๊ณ์ ๋ชฉ์
๊ฒฐ๊ตญ ์ ํฌ๊ฐ ํต๊ณ๋ฅผ ํตํด ์ป๊ณ ์ ํ๋ ๊ฒ์ ๋ค์๊ณผ ๊ฐ์ ๊ฒ๋ค์ผ ๊ฒ์ ๋๋ค.
"ํ๋ณธ๋ค์ด ์ด๋ฌ์ผ๋ ๋ชจ์ง๋จ์ ํ๊ท ์ ์ผ๋ง์ผ๊ฑฐ์ผ!"
"์ค๊ฐ ๋ชจ์ง๋จ์ ํ๊ท ์ด A์ผ๊ฑฐ๋ผ ์ฃผ์ฅํ๋๋ฐ ํ๋ณธ์ ๋ณด๋ A์ผ์๊ฐ ์๊ฒ ๋๊ฑธ?"
์ฒซ๋ฒ์งธ ๊ฒฝ์ฐ๋ ๋ชจ์์ ๋ํ "์ถ์ "์ ํ๋ ๊ฒ์ด๊ณ
๋๋ฒ์งธ ๊ฒฝ์ฐ๋ ๊ฐ์ค์ ๋ํ "๊ฒ์ "์ ํ๋ ๊ฒ์ ๋๋ค.
์ด๋ค ์ํฉ์ด๋ , ์ ํฌ๋ ๋ชจ์ง๋จ์ ์ ์์กฐ์ฌ ํ ์ ์์ด์ ํ๋ณธ๋ค์ ์กฐ์ฌํฉ๋๋ค.
์กฐ์ฌํ ํ๋ณธ๋ค์ ํตํด ํต๊ณ๋ฅผ ๋ด๊ณ , ์ด๋ฅผ ํตํด ๋ชจ์ง๋จ์ ์ถ์ , ํน์ ๊ฒ์ ์ ์งํํฉ๋๋ค.
์์ผ๋ก ๋ฐฐ์ธ ๋ด์ฉ์ ํ๋ณธ๋ค์ ์ถ์ถํ์ฌ ํต๊ณ๋ฅผ ๋ด์์ ๋ ๊ทธ๋ ค์ง๋ ๋ถํฌ์ ์ด๋ค์ ์์ฑ์ ๋ฐฐ์ธ ๊ฒ์ ๋๋ค.
์ด์ ์ ๋ฐฐ์ด ์ค์ฌ๊ทนํ์ ๋ฆฌ๋ ํ๋ณธ์ ์๊ฐ ์ปค์ง๋ฉด ํ๋ณธํ๊ท ์ ์ ๊ท๋ถํฌ์ ์๋ ดํ๋ค๋ ๋ด์ฉ์ด์๊ณ ,
M.L.E ๋ ๊ด์ฐฐ๋ ํ๋ฅ ๋ณ์๋ค, ์ฆ ์กฐ์ฌ๋ ํ๋ณธ๋ค์ ํตํด ๋ชจ์๊ฐ ์ด๋ ํ ๊ฐ์ ๊ฐ์ง ํ๋ฅ ์ด ๊ฐ์ฅ ๋์์ง์ ๋ํ ๋ด์ฉ์ด์์ต๋๋ค.
์ค์ฌ๊ทนํ์ ๋ฆฌ์ ์ํด ํ๋ณธํ๊ท ์ ํ๊ท ์ ๋ชจํ๊ท ์ ์๋ ดํ๊ณ ,
M.L.E์ ์ํด ํ๋ณธ๋ค์ด ์ถ์ถ๋์์ ๋, ํด๋น ํ๋ณธ๋ค์ ํ๊ท ์ด ๋ชจํ๊ท ์ผ ๊ฐ๋ฅ์ฑ์ด ๊ฐ์ฅ ์ปธ์ต๋๋ค.
์์์ ํ๋ณธํ๊ท ์ด๋ผ๋ ๋จ์ด๊ฐ ์ ๋ง ๋ง์ด ๋ฑ์ฅํ์ต๋๋ค.
ํ๋ณธํ๊ท ์ ๊ฒฐ๊ตญ ํ๋ณธ๋ค์ ์ถ์ถํ์ฌ ์ป์ ์ ์๋ ๊ฐ์ฅ ๋ํ์ ์ธ ํต๊ณ๋์ผ๋ก, ์ด๋ฅผ ํตํด ๋ชจํ๊ท ๊ณผ ๋ชจ๋ถ์ฐ์ ์ถ์ ํ๋ ๋ฐ ์ฌ์ฉ๋ ์ ์์ต๋๋ค.
์์ผ๋ก ์งํ๋ ๋ด์ฉ๋ค์ ์์, ๊ฒฐ๊ตญ ์ฐ๋ฆฌ์ ์ต์ข ๋ชฉ์ ์ ํ๋ณธ์ ํตํ ๋ชจ์์ ์ถ์ ํน์, ๊ฒ์ ์ ํ๋ ๊ฒ์ด๋ผ๋ ๊ฒ์ ํ๋ฒ ์๊ธฐํ๊ณ ์งํํ๊ฒ ์ต๋๋ค.
๋ชจ์์ ํต๊ณ๋
๋ชจ์(parameter) - ํต๊ณ์ ์ถ๋ก ์์ ๋ถ์ํ๊ณ ์ ํ๋ ์ต์ข ๋ชฉํ์ธ ๋ชจ์ง๋จ(population)์ ํน์ฑ
ํต๊ณ๋(statistic) - ๋ชจ์ง๋จ์์ ์ถ์ถํ ํ๋ณธ(random sample)์ ์ด์ฉํด ๋ง๋ ๊ฒ์ผ๋ก ํ๋ณธ๋ค์ ํจ์
ํต๊ณ์ ๊ฒ์ ์ ์ํด ํน์ํ ํต๊ณ๋์ ์ฌ์ฉํ๊ธฐ๋ ํ๊ณ , ๋ชจ์๋ฅผ ์ถ์ ํ๊ธฐ ์ํด ํต๊ณ๋์ ๊ตฌํด๋ณด๊ธฐ๋ ํฉ๋๋ค.
์ ์์ ๊ฒฝ์ฐ ๊ฒ์ ํต๊ณ๋(test statistic), ํ์์ ๊ฒฝ์ฐ ์ถ์ ๋(estimator)์ด๋ผ๊ณ ํฉ๋๋ค.
์ด์ ๊ธ์์ ๋ค๋ฃจ์๋ ์ต๋์ฐ๋๋ฒ(Maximun Likehood Estimator)์ด ๋ฐ๋ก ๋ชจ์์ ๋ํ ํต๊ณ๋, ์ฆ ์ถ์ ๋์ ๊ตฌํ ๊ฒ์ ๋๋ค.
ํต๊ณ๋์ ๊ผญ ํ๋ณธํ๊ท , ํ๋ณธ๋ถ์ฐ๊ณผ ๊ฐ์ด ๋ชจ์๋ฅผ ์ถ์ ํ๋ ๊ฒ๋ค๋ง์ด ์๋๋๋ค.
ํ๋ณธ๋ค๋ก๋ง ์ด๋ฃจ์ด์ง ํจ์๋ ์ ๋ถ ๋ค ํต๊ณ๋์ ๋๋ค.
๋ค๋ง ์ด์ค์์ ํ๋ณธํ๊ท ๊ณผ ํ๋ณธ๋ถ์ฐ์ด ๋งค์ฐ ์์ฃผ ์ฌ์ฉ๋๋ ํต๊ณ๋์ ๋๋ค.
ํต๊ณ๋์ ์ ์
๊ด์ฐฐ ๊ฐ๋ฅํ n๊ฐ์ ํ๋ฅ ๋ณ์ X1, ..., Xn์ด ์๋ค๊ณ ๊ฐ์ ํ์์ ๋,
r์ n๊ฐ์ ์ค์ ๋ณ์์ ๋ํ ์์์ ์คํจ์(real-valued function : ํจ์๊ฐ์ด ์ค์๋ผ๋ ๋ป)๋ผ ํ๋ฉด,
์ด๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋ ํ๋ฅ ๋ณ์ T๋ฅผ ํต๊ณ๋(statistic)์ด๋ผ ํฉ๋๋ค.
์ด๋ ค์ด ๋จ์ด๋ผ ์๊ฐํ์ง ๋ง์๊ณ , ์ฐ๋ฆฌ๊ฐ ๋ชจ์ง๋จ์ ์กฐ์ฌํ๊ธฐ ์ํด ํ๋ณธ๋ค์ ์กฐ์ฌํ์ฌ ํต๊ณ์น๋ฅผ ๋ธ ๊ทธ ๋ชจ๋ ๊ฒ๋ค์ด ํต๊ณ๋์ ๋๋ค.
์๋ฅผ ๋ค์ด
ํ๋ณธ๋ค์ ์กฐ์ฌํ๋ ํ๊ท ์ด A๋๋ผ -> ํต๊ณ๋
ํ๋ณธ๋ค์ ์กฐ์ฌํ๋ ๋ถ์ฐ์ด B๋๋ผ -> ํต๊ณ๋
๊ฐ ํ๋ณธ๋ค์ 10์ ๋ํ๊ณ 2๋ก ๋๋๊ณ ๋ญ ํ๊ณ ๋ญ ํ๋ ๋ญ๋๋ผ -> ํต๊ณ๋
ํ๋ณธ๋ถํฌ
ํ๋ณธ๋ถํฌ๋ ์ฝ๊ฒ ๋งํ๋ฉด ํต๊ณ๋์ ๋ํ ๋ถํฌ์ ๋๋ค.
์ฐ๋ฆฌ๊ฐ ๋ชจ์ง๋จ์ ๋ํด์ n๊ฐ์ ํ๋ณธ๋ค์ ๋ฝ์ ์กฐ์ฌํ ๋ ๋๋ถ๋ถ์ ๊ฒฝ์ฐ ํด๋น ์กฐ์ฌ์ ๋จ ํ๋ฒ๋ง ์งํํ์ง๋ ์์ต๋๋ค.
์ฌ๋ฌ๋ฒ ๊ฐ์ ์์ ํ๋ณธ๋ค์ ๋ฝ์ ์กฐ์ฌํ ํ, ๊ฐ๊ฐ ์กฐ์ฌ์ ๋ํ ํต๊ณ์น๋ค์ ์ฌ์ฉํ์ฌ, ํด๋น ํต๊ณ์น๋ค์ ํ๊ท ์ ๊ตฌํ๊ณ ์ด๋ฅผ ํตํด ๋ชจ์ง๋จ์ ์ถ์ธกํฉ๋๋ค.
์กฐ๊ธ ๋ ์ฝ๊ฒ ์ดํดํ๊ธฐ ์ํด, ์ ๊ตญ ์ด๋ฑํ์๋ค์ IQ์ ํ๊ท ์ ๊ตฌํด์ผ ํ๋ค๋ ์ํฉ์ ์ง๋ฉดํ๋ค๊ณ ์๊ฐํด๋ณด๊ฒ ์ต๋๋ค.
๋งจ ์ฒ์ 100๋ช ์ ํ์๋ค์ ๋ฝ์ ํ๊ท ์ ๋ด์๋๋ 130์ด์์ต๋๋ค.
๊ทธ๋ ๋ค๋ฉด ์ ํฌ๋ ์ ์ ๊ตญ ์ด๋ฑํ์๋ค์ IQ์ ํ๊ท ์ 130์ผ๊ฑฐ์ผ! ๋ผ๊ณ ํ๋จํ๋์?
์๋๋๋ค. ์ด๋ฌํ ํ๋ณธ๋ค์ ๋ฝ์ ์กฐ์ฌํ๋ ๊ณผ์ ์ ์ฌ๋ฌ๋ฒ ๊ฑฐ์น ํ, ํด๋น ํ๋ณธ๋ค์ ํ๊ท ์ ํตํด ์ ๊ตญ ์ด๋ฑํ์๋ค์ IQ์ ๋ํ ํ๊ท ์ ๋ผ ๊ฒ์ ๋๋ค.
์ฝ๊ฒ ๋งํด 100๋ช ์ ํ์๋ค์ ์กฐ์ฌํ๋ ์์ ์ 50๋ฒ ์งํํ๋๋, ํด๋น ํ๋ณธ๋ค์ ํ๊ท ์ ํ๊ท ์ด 100์ด์๋ค๊ณ ๊ฐ์ ํ๊ฒ ์ต๋๋ค.
์ด์ ์ฐ๋ฆฌ๋ ์ ๊ตญ ์ด๋ฑํ์๋ค์ IQ๋ ํ๊ท ์ ์ผ๋ก 100์ผ๊ฑฐ์ผ ๋ผ๋ ํ๋จ์ ๋ด๋ฆด ์ ์์ต๋๋ค.
์ ๊ณผ์ ์์ ํ๋ณธ๋ค์ ํ๊ท ์ ํ๊ท , ์ฆ ํ๋ณธํ๊ท ์ ํ๊ท ์ ์ฌ์ฉํ์ต๋๋ค.
์งํํ 50๋ฒ์ ์กฐ์ฌ์์ ํ๋ณธํ๊ท ๋ค์ ํ๊ท ์ ๊ทธ๋ํ ์์ ํ์ํ ์ ์์ ๊ฒ์ ๋๋ค.
์ด๊ฒ์ด ๋ฐ๋ก ํ๋ณธํ๊ท ์ ๋ถํฌ, ์ฆ ํต๊ณ๋์ ๋ํ ๋ถํฌ์ ํ ์์๊ฐ ๋๋ ๊ฒ์ ๋๋ค.
ํ๋ณธ๋ถํฌ์ ์ ์
ํ๋ฅ ๋ณ์ X = (X1, ..., Xn)์ด ๊ฐ์ ๋ชจ๋ฅด๋ ๋ชจ์ ฮธ๋ฅผ ๊ฐ์ง ๋ถํฌ์์ ์์๋ก ์ถ์ถ๋ n๊ฐ์ ํ๋ณธ๋ค์ด๋ผ ๊ฐ์ ํ๊ณ ,
T๋ฅผ X์ ๋ชจ์ ฮธ์ ๋ํ ํจ์๋ผ ํ๊ฒ ์ต๋๋ค. ์ฆ T(X1, X2, ..., Xn, ฮธ) ์ ๋๋ค.
ฮธ๊ฐ ์ฃผ์ด์ก์ ๋, T์ ๋ถํฌ๋ฅผ T์ ๋ํ ํ๋ณธ ๋ถํฌ(Sampling Distribution)๋ผ ํฉ๋๋ค.
ํ๋ณธ ๋ถํฌ๋ผ๋ ์ด๋ฆ์ T๊ฐ ๋ฌด์์ ํ๋ณธ(random sample)์ ์์กดํ๊ณ , ๋ฐ๋ผ์ T์ ๋ถํฌ ์ญ์ ํ๋ณธ์ผ๋ก๋ถํฐ ์ ๋๋๋ค๋ ์ฌ์ค๋ก๋ถํฐ ๋น๋กฏ๋ ์ด๋ฆ์ ๋๋ค.
๊ทธ๋ฆฌ๊ณ (T์ ๋ํ) ํ๋ณธ ๋ถํฌ๋ก๋ถํฐ ๊ณ์ฐ๋ T์ ํ๊ท ์ ๋ค์๊ณผ ๊ฐ์ด ๋ํ๋ด๊ฒ ์ต๋๋ค.
์ข ์ข ํ๋ฅ ๋ณ์ T๋ ๋ชจ์ ฮธ์ ๋ํด ์์กด์ ์ด์ง ์์ต๋๋ค. (์ด ๊ฒฝ์ฐ T๋ ํต๊ณ๋(statistic)์ด๋ผ ๋ถ๋ฆฝ๋๋ค)
ํนํ T๊ฐ ๋ชจ์ ฮธ์ ๋ํ ์ถ์ ๋(estimator)์ธ ๊ฒฝ์ฐ์๋ T๋ X์ ๋ํ ํจ์์ด๋ฏ๋ก ํต๊ณ๋(statistic)์ ๋๋ค.
๋ฐ๋ผ์, ์์น์ ์ผ๋ก๋ ๊ฐ๊ฐ์ ๋ชจ์์ ๋ํ ์ถ์ ๋(estimator)์ ํ๋ณธ ๋ถํฌ๋ฅผ ์ ๋ํ๋ ๊ฒ์ด ๊ฐ๋ฅํฉ๋๋ค.
ํ๋ณธ ํ๊ท ์ ๋ถํฌ
์๊น ํ์๋ค์ IQ ์์์์ ์ดํด๋ณด์๋ฏ์ด, ํ๋ณธํ๊ท ์ ๋ถํฌ๋ ํ๋ณธ ๋ถํฌ์ ๋ํ์ ์ธ ์์์ ๋๋ค.
์ ํฌ๋ ์ง๊ธ๊น์ง ํ๋ณธํ๊ท ์ ์ฌ๋ฌ๊ฐ์ง ์์ฑ๋ค๊ณผ ์ค์ฌ๊ทนํ์ ๋ฆฌ(Central Limit Theorem, CLT)์ ๋ํด ์์๋ณด์์ต๋๋ค.
์ฆ ํ๋ณธ ํ๊ท ์ ๋ถํฌ์ ๋ํ ์ฌ๋ฌ ์์ฑ๋ค์ ์์๋ณธ ๊ฒ์ด๋ฉฐ, ํ๋ฒ ์ ๋ฆฌํ๊ณ ๋์ด๊ฐ๊ฒ ์ต๋๋ค.
2. ๋ชจ์ง๋จ์ ๋ถํฌ์ ์๊ด์์ด, n์ด ์ถฉ๋ถํ ํฌ๋ค๋ฉด ๋ค์์ด ๊ทผ์ฌ์ ์ผ๋ก ์ฑ๋ฆฝํฉ๋๋ค. (์ค์ฌ๊ทนํ์ ๋ฆฌ, CLT)
์ด์ ๋ถํฐ ์ ๊ท๋ถํฌ์ ๋ฌด์์ ํ๋ณธ(random sample)์ ๋ํด ํ๋ณธ ๋ถ์ฐ์ ๋ถํฌ์, ํ๋ณธ ํ๊ท ๋ฐ ํ๋ณธ ๋ถ์ฐ์ ๋ค์ํ ํจ์์ ๋ํ ๋ถํฌ๋ฅผ ๋์ถํด ๋ณด๊ฒ ์ต๋๋ค.