๊ฐ์ค ๊ฒ์
์ด๋ ํ ์ถ์ธก์ด๋ ๊ฐ์ค์ ๋ํ์ฌ, ํด๋น ๊ฐ์ค์ ํ๋น์ฑ์ ์กฐ์ฌํ๋ ๊ฒ์ ๊ฐ์ค ๊ฒ์ ์ด๋ผ๊ณ ํฉ๋๋ค.
ํต๊ณ์ ๊ฐ์ค
ํต๊ณ๋ฅผ ํตํด ์ ์ ์๋ ๊ฒ์ ํ๊ท ๊ณผ ํ์คํธ์ฐจ์ ๊ฐ์ ๋ชจ์(parameter)์ ๋๋ค.
์ฆ ๋ชจ์(parameter)์ ๋ํ ์์, ์ถ์ธก ๋ฑ์ ํตํ์ด ํต๊ณ์ ๊ฐ์ค์ด๋ผ ๋ถ๋ฆ ๋๋ค.
'์ด๋ค ์ง๋จ์ ํ๊ท ์ A์ผ๊ฑฐ์ผ!' ๋ฑ์ ์์๋ก ๋ณผ ์ ์์ต๋๋ค.
ํต๊ณ์ ๊ฐ์ค ๊ฒ์
ํต๊ณ์ ๊ฐ์ค ๊ฒ์ ์ ํต๊ณ์ ๊ฐ์ค์ ๋ํ์ฌ ํด๋น ๊ฐ์ค์ ํ๋น์ฑ์ ์กฐ์ฌํ๋ ๊ฒ์ ๋๋ค.
ํต๊ณ์ ๊ฐ์ค ๊ฒ์ ์ ์ํด์๋ ๋๊ฐ์ ๋๋ฆฝ๋ ๊ฐ์ค์ด ํ์ํฉ๋๋ค.
์ด์ ๋ถํฐ ์ดํด๋ฅผ ๋๊ธฐ ์ํด ์น๊ตฌ ํ๋ช ์ ํตํด ๋ค์ ์์๋ฅผ ํ๋ ์๊ฐํด ๋ณด๊ฒ ์ต๋๋ค.
์น๊ตฌ์ ์ด๋ฆ์ ๊น์ ๊ฒธ์ด๋ผ๊ณ ํ๊ฒ ์ต๋๋ค.
์ด๋ ํ ๋ชจ์ง๋จ์ ๋ํ์ฌ ์ ๊ฒธ์ด๊ฐ ํด๋น ๋ชจ์ง๋จ์ ํ๊ท ์ A๋ผ๊ณ ์ฃผ์ฅํ๊ณ ์์ต๋๋ค.
๋น์ ์ ์ ๊ฒธ์ด๊ฐ ๋๋ฌด๋ ๊ผด๋ต๊ธฐ ์ซ์ด์, ์ ๊ฒธ์ด์ ์ฃผ์ฅ์ด ์๋ชป๋์๋ค๋ ๊ฒ์ ์ ์ฆํ๊ณ ์ถ์ดํฉ๋๋ค.
์ ๊ฒธ์ด์ ์ฃผ์ฅ์ด ์๋ชป๋์์์ ํ์ธํ๊ธฐ ์ํด์๋ ๋ชจ์ง๋จ ์ ์ฒด๋ฅผ ์ ์์กฐ์ฌ ํด์ผํ์ง๋ง, ์ด๋ ๋ถ๊ฐ๋ฅํ๊ธฐ์ ํฌ๊ธฐ n์ธ ํ๋ณธ์ ๋ฝ์์ต๋๋ค.
ํ๋ณธ์ ๋ฝ์ ํ๋ณธ์ ํ๊ท ๊ณผ ๋ถ์ฐ์ ๊ตฌํด๋ณด๋ ๋ค์๊ณผ ๊ฐ์์ต๋๋ค.
$$ํ๊ท : \overline{X}_n$$
$$๋ถ์ฐ : \sigma^{2}$$
ํ๋ณธํ๊ท ์ ํ๊ท ์ ๋ชจํ๊ท ๊ณผ ๋์ผํ๋ค๋ ๊ฒ์ ์ง๊ธ๊น์ง ๋ฐฐ์ ์ต๋๋ค.
์ ํฌ๋ ์ ๊ฒธ์ด์ ์ฃผ์ฅ์ด ํ๋ ธ๋ค๋ ๊ฒ์ ์ ์ฆํ๊ณ ์ถ์ผ๋ฏ๋ก, ์ ๊ฒธ์ด์ ์ฃผ์ฅ์ ๋ฐ๋ฅธ ๊ฐ์ค์ ์ธ์ด ๋ค ํด๋น ๊ฐ์ค์ด ํ๋ ธ์์ ๋ณด์ฌ์ผ ํฉ๋๋ค.
์ ๊ฒธ์ด์ ์ฃผ์ฅ์ ๋ฐ๋ผ ๋ค์๊ณผ ๊ฐ์ ๊ฐ์ค์ ์ธ์ธ ์ ์์ต๋๋ค.
$$E(\overline{X}_n) = A$$
ํ๋ ธ์์ ๋ณด์ด๊ณ ์ถ์ ๊ฐ์ค, ํ๋ ธ๋ค๊ณ ์์ํ๋ ๊ฐ์ค์ ๊ท๋ฌด๊ฐ์ค(null hypothesis, H0)์ด๋ผ๊ณ ํฉ๋๋ค.
์ฆ ์ ๊ฒธ์ด์ ์ฃผ์ฅ์ด ๋ฐ๋ก ๊ท๋ฌด๊ฐ์ค์ ๋๋ค.
์ด์ ๋ฐ๋๋๊ฒ ์ฐ๋ฆฌ๊ฐ ์ ์ฆํ๊ณ ์ ํ๋ ๊ฐ์ค์ ๋๋ฆฝ๊ฐ์ค(alternative hypothesis, H1)์ด๋ผ๊ณ ํฉ๋๋ค.
์ฆ ๋๋ฆฝ๊ฐ์ค์ ์ฐ๋ฆฌ๊ฐ ์ ์ฆํ๊ณ ์ ํ๋ ๊ฐ์ค์ด๋ฉฐ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$E(\overline{X}_n) \neq A$$
๊ท๋ฌด๋ ํ์์ด๋ก '๋์๊ฐ ๊ท'์ '์์ ๋ฌด' ์ ๋๋ค.
์ฆ ๊ธฐ์กด์ ๊ฒ๊ณผ ๋ณ ์ฐจ์ด๊ฐ ์๋ ๊ฐ์ค์ ๋๋ค.
์์ด๋ก๋ null, ์ฆ ์๋ฌด๋ฐ ๊ฐ์น๊ฐ ์๋ ๊ฐ์ค์ด๋ผ๋ ๋ป์ ๋๋ค.
๋๋ฆฝ๊ฐ์ค (alternative hypothesis, H1)
๋ชจ์ง๋จ์ ๋ํด ์๋กญ๊ฒ ์ ๊ธฐ๋ ์ด๋ก ์ด๋ ์ฃผ์ฅ์ ์๋ฏธํฉ๋๋ค.
ํ๋ณธ์ ์ด์ฉํ์ฌ ์ ์ฆํ๊ณ ์ ํ๋ ๊ฐ์ค์ ๋๋ค.
์ด๋ ๊ธฐํธ๋ก ๋ค์๊ณผ ๊ฐ์ด ํํํฉ๋๋ค.
$$H_1$$
๊ท๋ฌด๊ฐ์ค (null hypothesis, H0)
๋๋ฆฝ๊ฐ์ค๊ณผ ๋ฐ๋๋๋ ๊ฐ์ค์ ๋๋ค.
์ด๋ ๊ธฐํธ๋ก ๋ค์๊ณผ ๊ฐ์ด ํํํฉ๋๋ค.
$$H_0$$
์ ํฌ๋ ์ ๊ฒธ์ด์ ์ฃผ์ฅ, ์ฆ ๊ท๋ฌด๊ฐ์ค์ด ํ๋ ธ์ ๋ณด์ด๊ณ , ๋๋ฆฝ๊ฐ์ค์ ์ฑํํ๊ณ ์ถ์ ์ํฉ์ ๋๋ค.
1ํ๋ณธ Z๊ฒ์
์ ๊ฒธ์ด์ ์ฃผ์ฅ์ด ํ๋ ธ์์ ๋ณด์ด๊ธฐ ์ํด ํฌ๊ธฐ n์ธ ํ๋ณธ์ ๋ฝ์์์ต๋๋ค.
ํ๋ณธ์ ์ n์ด ์ถฉ๋ถํ ์ปค์, ํ๋ณธํ๊ท ์ ๋ถํฌ๊ฐ ์ ๊ท๋ถํฌ์ ๊ทผ์ฌํ๋ค๊ณ ๊ฐ์ ํ๊ฒ ์ต๋๋ค.
์ด๋ ํ๋ณธํ๊ท ์ ํ๊ท ์ ์ ๊ฒธ์ด๊ฐ ์ฃผ์ฅํ๋ A์ ๊ฐ๋ค๊ณ ํ๊ฒ ์ต๋๋ค. ์ฆ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
$$\overline{X}_n \; \sim \; N(A, \frac{\sigma^{2}}{n})$$
์ด๋ ์ ํฌ๊ฐ ๋ฝ์ ํ๋ณธ์ ํ๊ท ์ ๋ค์๊ณผ ๊ฐ์ด ๋ํ๋ด๋ณด๊ฒ ์ต๋๋ค.
$$\overline{X}_1$$
์ค์ ํ๋ณธ์ ๊ฐ์ ๊ตฌํ ๋ค, ์ด๋ฅผ ์ ๊ท๋ถํฌ์ ๊ทธ๋ํ ์์ ํ์ํด ๋ณด๊ฒ ์ต๋๋ค.
์ ๊ฒธ์ด์ ์ฃผ์ฅ๋๋ก ๋ชจ์ง๋จ์ ํ๊ท ์ด A์ธ ๊ฒฝ์ฐ์
์ ํฌ๊ฐ ๋ฝ์ ํ๋ณธ์ ํ๊ท (X_1) ์ด์์ ํ๊ท ๊ฐ์ ๊ฐ๋ ํ๋ณธ์ด ๋ฝํ ํ๋ฅ ์ด ๊ณ์ฐ ๊ฒฐ๊ณผ 0.02, ์ฆ 2%๊ฐ ๋์๋ค๊ณ ํ๊ฒ ์ต๋๋ค.
(ํด๋น ๊ณ์ฐ์ ํ์ค์ ๊ท๋ถํฌํ๋ฅผ ์ฌ์ฉํ์ฌ ๊ตฌํ ์ ์์ต๋๋ค.)
์ ๊ฒฝ์ฐ์, ๋ ๊ฐ์ง ๊ฐ๋ฅ์ฑ์ด ์์ต๋๋ค.
1. 2%๋ผ๋ ๋ฎ์ ํ๋ฅ ๋ก ํ๋ณธ์ด ๋ฝํ๊ฑฐ๋
2. ์ ๊ฒธ์ด์ ๊ฐ์ค์ด ํ๋ ธ๊ฑฐ๋
ํต๊ณํ์์๋ 1๋ฒ์ ๊ฐ๋ฅ์ฑ์ด ํฌ๋ฐํ๊ธฐ์ 2๋ฒ์ ๊ฐ๋ฅ์ฑ์ ์ ํํฉ๋๋ค.
์ด์ ์ ๊ฒธ์ด์ ๊ฐ์ค, ์ฆ ๊ท๋ฌด๊ฐ์ค์ ๊ธฐ๊ฐ(reject)ํ๊ณ ๋๋ฆฝ๊ฐ์ค์ ์ฒดํํฉ๋๋ค.
์ง๊ธ๊น์ง ์ ํฌ๋ ํ๊ท ์ด A๋ผ๋ ์ ๊ฒธ์ด์ ์ฃผ์ฅ์ด ํ๋ ธ์์ ํ๋ฅ ์ ์ผ๋ก ๊ฒ์ ํ์ต๋๋ค.
์์๊ฐ์ ๊ฒ์ ์ 1ํ๋ณธ Z ๊ฒ์ ์ด๋ผ๊ณ ํฉ๋๋ค.
ํ์ค์ ๊ท๋ถํฌ๋ฅผ Z๋ถํฌ๋ผ ํ๋ฉฐ, ๊ฒ์ ์ ์์ด์ Z๋ถํฌ๋ฅผ ์ฌ์ฉํ์ผ๋ฉฐ, 1๊ฐ์ ํ๋ณธ์ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ ๋๋ค.
์ ์์์ค (Significance level, α)
์์ ๊ฐ์ค์ ๊ธฐ๊ฐ(reject)ํ๋ ๊ณผ์ ์์ ํ๊ฐ์ง ์๋ฌธ์ ์ด ์๊น๋๋ค.
๊ณผ์ฐ ๋ช% ํ๋ฅ ๊น์ง๋ฅผ ํฌ๋ฐํ๋ค๊ณ ์๊ฐํ๊ณ ๊ฐ์ค์ ๊ธฐ๊ฐํ ๊น์?
๊ท๋ฌด๊ฐ์ค์ ๊ธฐ๊ฐํ๋ ํ๋ฅ ์ ์ ์์์ค(significance level)์ด๋ผ๊ณ ๋ถ๋ฆ ๋๋ค.
๊ธฐํธ๋ก๋ ์ํ(α)๋ฅผ ์ฌ์ฉํฉ๋๋ค.
ํต๊ณํ์์๋ ์ผ๋ฐ์ ์ผ๋ก 5%๋ก ์ ํฉ๋๋ค.
์ฆ ์ผ๋ฐ์ ์ผ๋ก α = 0.05์ ๋๋ค.
์ ์ํ๋ฅ (Signufucance probability, p-value)
์ ํฌ๊ฐ ๋ฝ์ ํ๋ณธ์ด ๊ทธ๋ํ ์์์ 2%์ ์์ญ์ ์ํ์์ต๋๋ค.
๋ฝ์ ํ๋ณธ์ ํ๊ท ์ด ์ํด์๋ ์์ญ์ ํ๋ฅ ์ ์ ์ํ๋ฅ (Signufucance probability)์ด๋ผ๊ณ ํฉ๋๋ค.
๊ธฐํธ๋ก๋ p๋ฅผ ์ฌ์ฉํ๋ฉฐ, ์ฃผ๋ก p-value๋ผ๊ณ ๋ถ๋ฆ ๋๋ค
๊ท๋ฌด๊ฐ์ค์ด ๊ธฐ๊ฐ๋๋ ์กฐ๊ฑด์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค
$$p-value < 0.025$$
์ด๋ ์ ์์์ค์ ์ ๋ฐ๊ฐ์ธ๋ฐ, 0.5๊ฐ ์๋ 0.025๋ฅผ ์ฌ์ฉํ๋์ง์ ๋ํ ์๋ฌธ์ ํ์ด๊ฐ๋๋ก ํ๊ฒ ์ต๋๋ค.
๊ธฐ๊ฐ์ญ (Rejection Region)
์ ์์์ค์ ํด๋น๋๋ ๊ทธ๋ํ ์์ ์์ญ์ ์๋ฏธํฉ๋๋ค.
์์ธก๊ฒ์
์ ์ ์ ๊ฒธ์ด์ ์ฃผ์ฅ์ธ ๊ท๋ฌด๊ฐ์ค์ ๋ ์ฌ๋ ค ๋ณด๊ฒ ์ต๋๋ค.
$$H_0 : \; E(\overline{X}_n) = A$$
์ ๊ฒธ์ด์ ์ฃผ์ฅ์ ๋ฐ๋ฅด๋ฉด, ํ๋ณธํ๊ท ์ ๋ถํฌ๋ ๋ค์๊ณผ ๊ฐ์ด ๊ทธ๋ ค์ง ๊ฒ์ ๋๋ค.
ํ๊ท ์ด ๋ฐ๋์ A๋ณด๋ค ํฐ ๊ฒฝ์ฐ์๋ง ์ ๊ฒธ์ด์ ์ฃผ์ฅ, ์ฆ ๊ท๋ฌด๊ฐ์ค์ ๊ธฐ๊ฐํ ์ ์์๊น์?
์๋๋๋ค. ํ๊ท ๋ณด๋ค ์์ ๊ฒฝ์ฐ์๋ ๊ธฐ๊ฐํ ์ ์์ต๋๋ค.
์ฆ ์ด ๊ฒฝ์ฐ ๊ธฐ๊ฐ์ญ์ ์ ๊ท๋ถํฌ์ ์ ๋์ ์กด์ฌํฉ๋๋ค.
๊ธฐ๊ฐ์ญ์ 5%์ด๋ฏ๋ก, ์์ชฝ์ ๊ฐ๊ฐ 2.5%์ฉ ๊ธฐ๊ฐ์ญ์ ๊ฐ์ต๋๋ค.
์ด์ ๊ฐ์ด ๊ธฐ๊ฐ์ญ์ด ์์ชฝ์ ์กด์ฌํ๋ ๊ฒ์ ์ ์์ธก๊ฒ์ (two-sided test ํน์ two tailed test)์ด๋ผ๊ณ ๋ถ๋ฆ ๋๋ค.
๋จ์ธก๊ฒ์
์์ธก๊ฒ์ ๊ณผ ๋ฐ๋๋ก ๊ธฐ๊ฐ์ญ์ด ํ์ชฝ์๋ง ์กด์ฌํ๋ ๊ฒ์ ์ ๋จ์ธก๊ฒ์ (one-sided test)์ด๋ผ๊ณ ๋ถ๋ฆ ๋๋ค.
๋จ์ธก๊ฒ์ ์ ์์๋ฅผ ์ํด ๋ค์ ์ํฉ์ ์๊ฐํด๋ณด๊ฒ ์ต๋๋ค.
์ ๊ฒธ์ด์ ์๋ก์ด ์ฃผ์ฅ์ ์ด๋ ์ต๋๋ค.
๋ชจ์ง๋จ์ ํ๊ท ์ A ์ดํ์ผ๊ฑฐ์ผ!
$$H_0 : \; E(\overline{X}_n) \leq A$$
์ด๋ฒ์๋ ์ ๊ฒธ์์ ์ฃผ์ฅ์ ๋ฌต์ด์ํค๊ธฐ ์ํด ๋ค์๊ณผ ๊ฐ์ ๋๋ฆฝ๊ฐ์ค์ ์ธ์๋๋ค.
$$E(\overline{X}_n) > A$$
์ ๊ฒฝ์ฐ์๋ ๊ธฐ๊ฐ์ญ์ด ๋ค์๊ณผ ๊ฐ์ด ์ค๋ฅธ์ชฝ์๋ง ์กด์ฌํฉ๋๋ค. ์ฆ ๊ธฐ๊ฐ์ญ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
1์ข ์ค๋ฅ(Type I Error), 2์ข ์ค๋ฅ(Type II Error)
์์ ๊ฐ์ ํต๊ณ์ ๊ฒ์ ์ ๊ฒฐ๊ณผ๋ก๋ ๋ค์ 4๊ฐ์ง ์ํฉ์ด ๋ฐ์ํ ์ ์์ต๋๋ค.
1. ๊ท๋ฌด๊ฐ์ค์ด ์ฐธ์ธ๋ฐ ์ฑํํ๋ ๊ฒฝ์ฐ (GOOD)
2. ๊ท๋ฌด๊ฐ์ค์ด ์ฐธ์ธ๋ฐ ๊ธฐ๊ฐํ๋ ๊ฒฝ์ฐ (1์ข ์ค๋ฅ, α์ค๋ฅ, Type I Error)
3. ๊ท๋ฌด๊ฐ์ค์ด ๊ฑฐ์ง์ธ๋ฐ ์ฑํํ๋ ๊ฒฝ์ฐ (2์ข ์ค๋ฅ, β์ค๋ฅ, Type II Error)
4. ๊ท๋ฌด๊ฐ์ค์ด ๊ฑฐ์ง์ธ๋ฐ ๊ธฐ๊ฐํ๋ ๊ฒฝ์ฐ (GOOD)
1์ข ์ค๋ฅ(α์ค๋ฅ, Type I Error)
๊ท๋ฌด๊ฐ์ค์ด ์ฐธ์ธ ์ํฉ์์, ํ๋ณธ์ด ๊ธฐ๊ฐ์ญ์ ์กด์ฌํ์ฌ ๊ท๋ฌด๊ฐ์ค์ ๊ธฐ๊ฐํ ๊ฒฝ์ฐ ๋ฐ์ํฉ๋๋ค.
๊ธฐ๊ฐ์ญ์ด ์ฐจ์งํ๋ ๋์ด๋ฅผ ์ ์์์ค๊ณผ ๊ฐ์ผ๋ฏ๋ก, 1์ข ์ค๋ฅ๊ฐ ๋ฐ์ํ ํ๋ฅ ์ ์ ์์์ค α์ ๊ฐ์ต๋๋ค.
๋ฐ๋ผ์ 1์ข ์ค๋ฅ๋ฅผ α์ค๋ฅ๋ผ๊ณ ๋ถ๋ฆ ๋๋ค.
์ ๊ฒธ์ด์ ์ฃผ์ฅ์ด ์ฌ์ผ๋ก ๋ง์๋๋ฐ, ํ๋ณธ์ด ๋ฎ์ ํ๋ฅ ๋ก ๊ธฐ๊ฐ์ญ์์ ๋ฝํ ์ ๊ฒธ์ด์ ์ฃผ์ฅ์ ๊ธฐ๊ฐํ ์ํฉ์ ๋๋ค.
2์ข ์ค๋ฅ(β ์ค๋ฅ, Type II Error)
๊ท๋ฌด๊ฐ์ค์ด ๊ฑฐ์ง์ธ ์ํฉ์์, ํ๋ณธ์ด ๊ธฐ๊ฐ์ญ์ ์กด์ฌํ์ง ์์ ๊ท๋ฌด๊ฐ์ค์ ์ฑํํ ๊ฒฝ์ฐ ๋ฐ์ํฉ๋๋ค.
์ ๊ฒธ์ด์ ์ฃผ์ฅ๊ณผ ๋ค๋ฅด๊ฒ, ์ค์ ๋ชจ์ง๋จ์ ํ๊ท ์ด μ๋ผ๊ณ ๊ฐ์ ํ๊ฒ ์ต๋๋ค.
์ด๋ ๋จ์ธก๊ฒ์ ์ ์์๋ก ํด๋น ์ํฉ์ ํ๋ฅ ๋ถํฌ๋ก ๊ทธ๋ ค๋ณด๊ฒ ์ต๋๋ค.
2์ข ์ค๋ฅ๊ฐ ๋ฐ์ํ ํ๋ฅ ์ β์ ๋๋ค.
๊ทธ๋ํ๋ฅผ ํตํด ํ์ธํ ์ ์๋ฏ์ด, 1์ข ์ค๋ฅ์ 2์ข ์ค๋ฅ๋ ์๋ก trade-off ๊ด๊ณ๋ฅผ ๊ฐ์ง๋๋ค.
๊ธฐ๊ฐ์ญ์ ์ค์ด๋ฉด 1์ข ์ค๋ฅ๋ ์ค์ด๋ค์ง๋ง, 2์ข ์ค๋ฅ๋ ๋์ด๋ฉ๋๋ค.
๊ธฐ๊ฐ์ญ์ ๋๋ฆฌ๋ฉด 2์ข ์ค๋ฅ๋ ์ค์ด๋ค์ง๋ง, 1์ข ์ค๋ฅ๋ ๋์ด๋ฉ๋๋ค.
Reference
https://www.youtube.com/watch?v=svp77vA4duk