๐Ÿ–ฅ Computer Science/ํ™•๋ฅ ๊ณผ ํ†ต๊ณ„

๊ฐ€์„ค ๊ฒ€์ • (Hypotheses testing) ์–ด๋– ํ•œ ์ถ”์ธก์ด๋‚˜ ๊ฐ€์„ค์— ๋Œ€ํ•˜์—ฌ, ํ•ด๋‹น ๊ฐ€์„ค์˜ ํƒ€๋‹น์„ฑ์„ ์กฐ์‚ฌํ•˜๋Š” ๊ฒƒ์„ ๊ฐ€์„ค ๊ฒ€์ •์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ๋ชจ์ˆ˜(parameter) $\theta$ ๊ฐ€ ์•Œ๋ ค์ง€์ง€ ์•Š์€ ์–ด๋– ํ•œ ๋ถ„ํฌ๋ฅผ ๊ฐ€์ •ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  $\Omega $ ๋ฅผ $\theta$ ์— ๋Œ€ํ•œ ๋ชจ์ˆ˜ ๊ณต๊ฐ„ (paramter space)์ด๋ผ ์ •์˜ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. $\Omega $ ๋ฅผ ๋ถ„ํ• (partition)ํ•˜๋Š” $\Omega_0 $ ๊ณผ $\Omega_1 $๋ฅผ ์ •์˜ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. ์ฆ‰ $\Omega_0 \cap \Omega_1 = \varnothing$ , $\Omega_0 \cup \Omega_1 =\Omega$ ์ž…๋‹ˆ๋‹ค. ์œ„์™€ ๊ฐ™์€ ์ƒํ™ฉ์—์„œ, ํ†ต๊ณ„ํ•™์ž๋Š” ์‹ค์ œ ๋ชจ์ˆ˜ $\theta$๊ฐ€ ์œ„ ๋‘ ๊ณต๊ฐ„ ์ค‘ ์–ด๋Š ๊ณต๊ฐ„์— ํฌํ•จ๋˜๋Š”์ง€ ๊ด€์‹ฌ์ด ..
๊ฐ€์„ค ๊ฒ€์ • ์–ด๋– ํ•œ ์ถ”์ธก์ด๋‚˜ ๊ฐ€์„ค์— ๋Œ€ํ•˜์—ฌ, ํ•ด๋‹น ๊ฐ€์„ค์˜ ํƒ€๋‹น์„ฑ์„ ์กฐ์‚ฌํ•˜๋Š” ๊ฒƒ์„ ๊ฐ€์„ค ๊ฒ€์ •์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ํ†ต๊ณ„์  ๊ฐ€์„ค ํ†ต๊ณ„๋ฅผ ํ†ตํ•ด ์•Œ ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์€ ํ‰๊ท ๊ณผ ํ‘œ์ค€ํŽธ์ฐจ์™€ ๊ฐ™์€ ๋ชจ์ˆ˜(parameter)์ž…๋‹ˆ๋‹ค. ์ฆ‰ ๋ชจ์ˆ˜(parameter)์— ๋Œ€ํ•œ ์˜ˆ์ƒ, ์ถ”์ธก ๋“ฑ์„ ํ†ตํ‹€์–ด ํ†ต๊ณ„์  ๊ฐ€์„ค์ด๋ผ ๋ถ€๋ฆ…๋‹ˆ๋‹ค. '์–ด๋–ค ์ง‘๋‹จ์˜ ํ‰๊ท ์€ A์ผ๊ฑฐ์•ผ!' ๋“ฑ์„ ์˜ˆ์‹œ๋กœ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ†ต๊ณ„์  ๊ฐ€์„ค ๊ฒ€์ • ํ†ต๊ณ„์  ๊ฐ€์„ค ๊ฒ€์ •์€ ํ†ต๊ณ„์  ๊ฐ€์„ค์— ๋Œ€ํ•˜์—ฌ ํ•ด๋‹น ๊ฐ€์„ค์˜ ํƒ€๋‹น์„ฑ์„ ์กฐ์‚ฌํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํ†ต๊ณ„์  ๊ฐ€์„ค ๊ฒ€์ •์„ ์œ„ํ•ด์„œ๋Š” ๋‘๊ฐœ์˜ ๋Œ€๋ฆฝ๋œ ๊ฐ€์„ค์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์ด์ œ๋ถ€ํ„ฐ ์ดํ•ด๋ฅผ ๋•๊ธฐ ์œ„ํ•ด ์นœ๊ตฌ ํ•œ๋ช…์„ ํ†ตํ•ด ๋‹ค์Œ ์˜ˆ์‹œ๋ฅผ ํ•˜๋‚˜ ์ƒ๊ฐํ•ด ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ์นœ๊ตฌ์˜ ์ด๋ฆ„์€ ๊น€์œ ๊ฒธ์ด๋ผ๊ณ  ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. ์–ด๋– ํ•œ ๋ชจ์ง‘๋‹จ์— ๋Œ€ํ•˜์—ฌ ์œ ๊ฒธ์ด๊ฐ€ ํ•ด๋‹น ๋ชจ์ง‘๋‹จ์˜ ํ‰๊ท ์€ A๋ผ๊ณ  ์ฃผ์žฅํ•˜๊ณ  ์žˆ์Šต..
Biased(ํŽธ์˜) ํŽธ์˜๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜๋ฉ๋‹ˆ๋‹ค. ํŽธ์˜ = ์ถ”์ •๋Ÿ‰์˜ ๊ธฐ๋Œ“๊ฐ’ - ๋ชจ์ˆ˜ ์˜ˆ๋ฅผ ๋“ค์–ด ๋Œ€ํ‘œ์ ์ธ ์ถ”์ •๋Ÿ‰์ธ ํ‘œ๋ณธํ‰๊ท ์— ๋Œ€ํ•œ ํŽธ์˜๋ฅผ ๊ตฌํ•ด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ํ‘œ๋ณธํ‰๊ท ์˜ ๊ธฐ๋Œ€๊ฐ’์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. ํ‘œ๋ณธํ‰๊ท ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์œผ๋ฏ€๋กœ $$\overline{X_n} = \frac{1}{n}\sum^{n}_{i=1}X_i$$ ํ‘œ๋ณธํ‰๊ท ์˜ ํ‰๊ท ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. $$E(\overline{X_n})=\frac{1}{n}\cdot E(X_1+X_2+\cdots +X_n) $$ $$=\frac{1}{n}\cdot (E(X_1)+E(X_2)+\cdots +E(X_n ))$$ $$=\frac{1}{n}\cdot n \cdot E(X_1)$$ $$= \frac{1}{n} \cdot n \cdot \mu = \mu $$ ์ฆ‰ ํ‘œ๋ณธํ‰๊ท (์ถ”์ •..
์ง€๊ธˆ๊นŒ์ง€ ์ €ํฌ๊ฐ€ ๋ฐฐ์šด ์นด์ด์ œ๊ณฑ๋ถ„ํฌ์™€ t๋ถ„ํฌ๋ฅผ ํ†ตํ•ด, ๋ชจ์ˆ˜(๋ชจํ‰๊ท , ๋ชจ๋ถ„์‚ฐ)์„ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ ๋งŒ ํ•˜์˜€์ง€ ์‹ค์ œ๋กœ ํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ๋ชจ๋ฅธ ์ฒด ๋„˜์–ด๊ฐ”์Šต๋‹ˆ๋‹ค. ์ด์ œ๋ถ€ํ„ฐ๋Š” ์ด ๋‘ ๋ถ„ํฌ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจํ‰๊ท ๊ณผ ๋ชจ๋ถ„์‚ฐ์„ ์ถ”์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด์„œ ์•Œ์•„๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ๊ทธ์ „์— ์šฐ์„  ์ง€๊ธˆ๊นŒ์ง€ ๋ฐฐ์› ๋˜ ์นด์ด์ œ๊ณฑ๋ถ„ํฌ์™€ T๋ถ„ํฌ์—์„œ ์ค‘์š”ํ•œ ๊ฒƒ์„๋“ค ์ •๋ฆฌํ•˜๊ณ  ๋„˜์–ด๊ฐ€๊ฒ ์Šต๋‹ˆ๋‹ค. T ๋ถ„ํฌ ๋ชจํ‰๊ท ์„ ์ถ”์ •ํ•  ๋•Œ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์ •๊ทœ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅด๋Š” ํ™•๋ฅ ๋ณ€์ˆ˜๋ฅผ ์ •๊ทœํ™”ํ•  ๋•Œ, ฯƒ(๋ชจ๋ถ„์‚ฐ) ๋Œ€์‹  ฯƒ'์„ ์‚ฌ์šฉํ•˜์—ฌ ์ •๊ทœํ™”ํ•œ๋‹ค๋ฉด U์™€ ๊ฐ™์•„์ง€๋ฉฐ, ๋”ฐ๋ผ์„œ ์ •๊ทœํ™”๋œ ๋ถ„ํฌ๋Š” SND์—์„œ ์ž์œ ๋„๊ฐ€ n-1์ธ t ๋ถ„ํฌ๋กœ ๋ฐ”๋€๋‹ˆ๋‹ค. $$Z = \frac{(\overline{X}_n-\mu)}{\frac{\sigma}{\sqrt{n}}} \; \sim \; N(0, 1^{2})$$ $$\fra..
(์ŠคํŠœ๋˜ํŠธ) T ๋ถ„ํฌ (Student t-distribution) ์ด์ „์— ๋ฐฐ์› ๋˜ ์นด์ด์ œ๊ณฑ ๋ถ„ํฌ๋Š” ํ‘œ๋ณธ๋“ค์˜ ํ†ต๊ณ„๋Ÿ‰์„ ํ†ตํ•ด์„œ, ๋ชจ์ง‘๋‹จ์˜ ๋ถ„์‚ฐ์„ ์ถ”์ •ํ•˜๋Š”๋ฐ ์‚ฌ์šฉ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋ฉด ๋ชจ์ง‘๋‹จ์˜ ํ‰๊ท ์€ ๋ฌด์—‡์œผ๋กœ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ์„๊นŒ์š”? ์ด๋ฒˆ์— ๋ฐฐ์šธ T๋ถ„ํฌ๋ฅผ ํ†ตํ•ด ๋ชจ์ง‘๋‹จ์˜ ํ‰๊ท ์„ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. T๋ถ„ํฌ๋Š” ์ŠคํŠœ๋˜ํŠธ T ๋ถ„ํฌ, ํ•™์ƒ T ๋ถ„ํฌ ๋“ฑ์œผ๋กœ ๋ถˆ๋ฆฌ๋ฉฐ, ํ‘œ๋ณธ๋ถ„์‚ฐ์„ ์ด์šฉํ•˜์—ฌ ์ •๊ทœ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅด๋Š” ๋ชจ์ง‘๋‹จ์˜ ํ‰๊ท ์„ ์ถ”์ •ํ•  ๋•Œ ์ฃผ๋กœ ์‚ฌ์šฉ๋˜๋Š” ๋ถ„ํฌ์ž…๋‹ˆ๋‹ค. ๋ชจํ‰๊ท ์— ๋Œ€ํ•œ ์‹ ๋ขฐ๊ตฌ๊ฐ„์ด๋‚˜ ๊ฐ€์„ค๊ฒ€์ •์—์„œ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. T ๋ถ„ํฌ์˜ ์ •์˜ ๋‘๊ฐœ์˜ ๋…๋ฆฝ์ธ ํ™•๋ฅ ๋ณ€์ˆ˜ Y , Z๋ฅผ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜ํ•  ๋•Œ, $$Y\; \sim \; \chi^{2}(m)$$ $$Z \; \sim \; N(0, 1^{2})$$ ํ™•๋ฅ ๋ณ€์ˆ˜ X๋ฅผ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜ํ•˜๋ฉด $$X = ..
$X_1$, ..., $X_n$์ด ํ‰๊ท  $\mu$์™€ ๋ถ„์‚ฐ $\sigma^2$๊ฐ€ ์•Œ๋ ค์ง€์ง€ ์•Š์€ ์ •๊ทœ๋ถ„ํฌ๋กœ๋ถ€ํ„ฐ ์ž„์˜์ถ”์ถœ๋œ ํ‘œ๋ณธ๋“ค์ด๋ผ ํ•  ๋•Œ, ํ‰๊ท  $\mu$์™€ ๋ถ„์‚ฐ $\sigma^2$์— ๋Œ€ํ•œ ์ตœ๋Œ€๊ฐ€๋Šฅ๋„ ์ถ”์ •๋Ÿ‰ (M.L.E)๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. $$\hat{\mu} = \overline{X_n}$$ $$\hat{\sigma^2} = \frac{\sum^{n}_{i=1}(X_i - \overline{X_n})^{2}}{n}$$ ์ง€๊ธˆ๋ถ€ํ„ฐ๋Š” ์ด๋Ÿฌํ•œ ๋‘ ์ถ”์ •๋Ÿ‰(estimator)์— ๋Œ€ํ•œ ๊ฒฐํ•ฉ๋ถ„ํฌ(joint distribution)๋ฅผ ์œ ๋„ํ•ด ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ์ €ํฌ๋Š” ์ด๋ฏธ ์ •๊ทœ๋ถ„ํฌ๋กœ๋ถ€ํ„ฐ ์ž„์˜์ถ”์ถœํ•œ ํ‘œ๋ณธํ‰๊ท ์€ ๊ทธ ์ž์ฒด๋กœ ์ •๊ทœ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅด๋Š” ๊ฒƒ์„ ์•Œ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. (์ค‘์‹ฌ๊ทนํ•œ์ •๋ฆฌ์— ์˜ํ•ด๊ฐ€ ์•„๋‹™๋‹ˆ๋‹ค.) $$\overline{X_n} \..
์นด์ด์ œ๊ณฑ ๋ถ„ํฌ ์นด์ด์ œ๊ณฑ ๋ถ„ํฌ๋ฅผ ๋ฐฐ์šฐ๊ธฐ ์ „์— ์นด์ด์ œ๊ณฑ ๋ถ„ํฌ๋ฅผ ์™œ ๋ฐฐ์šฐ๋Š”์ง€, ์–ด๋–จ ๋•Œ ์‚ฌ์šฉํ•˜๋Š”์ง€ ์•Œ์•„๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ์นด์ด์ œ๊ณฑ ๋ถ„ํฌ๋Š” ํ‘œ๋ณธ๋“ค์˜ ํ‰๊ท ๊ณผ ๋ถ„์‚ฐ์„ ํ†ตํ•ด, ์ •๊ทœ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅด๋Š” ๋ชจ์ง‘๋‹จ์˜ ๋ถ„์‚ฐ, ์ฆ‰ ๋ชจ๋ถ„์‚ฐ์„ ์ถ”์ •ํ•  ๋•Œ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์ด์ „์—๋„ ๋ง์”€๋“œ๋ ธ๋‹ค์‹ถ์ด, ์ €ํฌ์˜ ๋ชฉ์ ์€ ํ‘œ๋ณธ๋“ค์„ ๊ฐ€์ง€๊ณ  ๋ชจ์ˆ˜๋ฅผ ์ถ”์ •ํ•˜๊ฑฐ๋‚˜, ๋ชจ์ˆ˜์— ๋Œ€ํ•œ ๊ฐ€์„ค์„ ๊ฒ€์ •ํ•˜๋Š” ๊ฒƒ์ด์—ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ์ค‘ ๋ชจ์ง‘๋‹จ์˜ ๋ถ„์‚ฐ์„ ์ถ”์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์— ์‚ฌ์šฉ๋˜๋Š” ๊ฒƒ์ด ๋ฐ”๋กœ ์นด์ด์ œ๊ณฑ๋ถ„ํฌ์ž…๋‹ˆ๋‹ค. ๋ง›๋ณด๊ธฐ๋กœ ์–ด๋–ป๊ฒŒ ์ถ”์ •์ด ๊ฐ€๋Šฅํ•œ์ง€ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. (์นด์ด์ œ๊ณฑ ๋ถ„ํฌ์˜ ์ž์œ ๋„๋ผ๋˜๊ฐ€, ์‹์ด ๋„์ถœ๋˜๋Š” ๊ณผ์ •์€ ์ƒ๋žตํ•˜๊ณ , ์ถ”์ •์ด ๊ฐ€๋Šฅํ•œ ์ด์œ ์— ๋Œ€ํ•ด์„œ๋งŒ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.) ์šฐ์„  ๋‹ค์Œ์€ ์ž์œ ๋„ n์ธ ์นด์ด์ œ๊ณฑ ๋ถ„ํฌ๋ฅผ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ๊ฐ ์ž์œ ๋„์— ๋Œ€ํ•œ ์นด์ด์ œ๊ณฑ๋ถ„ํฌ๋Š” ์ด๋ฏธ ๊ตฌํ•ด์ ธ์žˆ์œผ๋ฉฐ, ๋Œ€๋ถ€๋ถ„ ํ‘œ๋กœ ์ฃผ์–ด์ง‘๋‹ˆ๋‹ค. ..
ํ†ต๊ณ„์˜ ๋ชฉ์  ๊ฒฐ๊ตญ ์ €ํฌ๊ฐ€ ํ†ต๊ณ„๋ฅผ ํ†ตํ•ด ์–ป๊ณ ์ž ํ•˜๋Š” ๊ฒƒ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๊ฒƒ๋“ค์ผ ๊ฒƒ์ž…๋‹ˆ๋‹ค. "ํ‘œ๋ณธ๋“ค์ด ์ด๋žฌ์œผ๋‹ˆ ๋ชจ์ง‘๋‹จ์˜ ํ‰๊ท ์€ ์–ผ๋งˆ์ผ๊ฑฐ์•ผ!" "์Ÿค๊ฐ€ ๋ชจ์ง‘๋‹จ์˜ ํ‰๊ท ์ด A์ผ๊ฑฐ๋ผ ์ฃผ์žฅํ–ˆ๋Š”๋ฐ ํ‘œ๋ณธ์„ ๋ณด๋‹ˆ A์ผ์ˆ˜๊ฐ€ ์—†๊ฒ ๋Š”๊ฑธ?" ์ฒซ๋ฒˆ์งธ ๊ฒฝ์šฐ๋Š” ๋ชจ์ˆ˜์— ๋Œ€ํ•œ "์ถ”์ •"์„ ํ•˜๋Š” ๊ฒƒ์ด๊ณ  ๋‘๋ฒˆ์งธ ๊ฒฝ์šฐ๋Š” ๊ฐ€์„ค์— ๋Œ€ํ•œ "๊ฒ€์ •"์„ ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์–ด๋–ค ์ƒํ™ฉ์ด๋“ , ์ €ํฌ๋Š” ๋ชจ์ง‘๋‹จ์„ ์ „์ˆ˜์กฐ์‚ฌ ํ•  ์ˆ˜ ์—†์–ด์„œ ํ‘œ๋ณธ๋“ค์„ ์กฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ์กฐ์‚ฌํ•œ ํ‘œ๋ณธ๋“ค์„ ํ†ตํ•ด ํ†ต๊ณ„๋ฅผ ๋‚ด๊ณ , ์ด๋ฅผ ํ†ตํ•ด ๋ชจ์ง‘๋‹จ์„ ์ถ”์ •, ํ˜น์€ ๊ฒ€์ •์„ ์ง„ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ์•ž์œผ๋กœ ๋ฐฐ์šธ ๋‚ด์šฉ์€ ํ‘œ๋ณธ๋“ค์„ ์ถ”์ถœํ•˜์—ฌ ํ†ต๊ณ„๋ฅผ ๋‚ด์—ˆ์„ ๋•Œ ๊ทธ๋ ค์ง€๋Š” ๋ถ„ํฌ์™€ ์ด๋“ค์˜ ์†์„ฑ์„ ๋ฐฐ์šธ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด์ „์— ๋ฐฐ์šด ์ค‘์‹ฌ๊ทนํ•œ์ •๋ฆฌ๋Š” ํ‘œ๋ณธ์˜ ์ˆ˜๊ฐ€ ์ปค์ง€๋ฉด ํ‘œ๋ณธํ‰๊ท ์€ ์ •๊ทœ๋ถ„ํฌ์— ์ˆ˜๋ ดํ•œ๋‹ค๋Š” ๋‚ด์šฉ์ด์—ˆ๊ณ , M.L.E ๋Š” ๊ด€์ฐฐ๋œ ํ™•๋ฅ ๋ณ€์ˆ˜๋“ค, ์ฆ‰ ..
๋ง ๋ž‘
'๐Ÿ–ฅ Computer Science/ํ™•๋ฅ ๊ณผ ํ†ต๊ณ„' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๊ธ€ ๋ชฉ๋ก