'🖥 Computer Science/확률과 통계' 카테고리의 글 목록

[확률과 통계] - (25) 가설 검정 [1] - 가설 검정 문제 (Problems of Testing Hypotheses)

2022.06.13· 🖥 Computer Science/확률과 통계

가설 검정 (Hypotheses testing) 어떠한 추측이나 가설에 대하여, 해당 가설의 타당성을 조사하는 것을 가설 검정이라고 합니다. 모수(parameter) $\theta$ 가 알려지지 않은 어떠한 분포를 가정하겠습니다. 그리고 $\Omega $ 를 $\theta$ 에 대한 모수 공간 (paramter space)이라 정의하겠습니다. $\Omega $ 를 분할(partition)하는 $\Omega_0 $ 과 $\Omega_1 $를 정의하겠습니다. 즉 $\Omega_0 \cap \Omega_1 = \varnothing$ , $\Omega_0 \cup \Omega_1 =\Omega$ 입니다. 위와 같은 상황에서, 통계학자는 실제 모수 $\theta$가 위 두 공간 중 어느 공간에 포함되는지 관심이 ..

[확률과 통계] - (24) 가설 검정[0] - 가설검정 이해하기

2022.06.07· 🖥 Computer Science/확률과 통계

가설 검정 어떠한 추측이나 가설에 대하여, 해당 가설의 타당성을 조사하는 것을 가설 검정이라고 합니다. 통계적 가설 통계를 통해 알 수 있는 것은 평균과 표준편차와 같은 모수(parameter)입니다. 즉 모수(parameter)에 대한 예상, 추측 등을 통틀어 통계적 가설이라 부릅니다. '어떤 집단의 평균은 A일거야!' 등을 예시로 볼 수 있습니다. 통계적 가설 검정 통계적 가설 검정은 통계적 가설에 대하여 해당 가설의 타당성을 조사하는 것입니다. 통계적 가설 검정을 위해서는 두개의 대립된 가설이 필요합니다. 이제부터 이해를 돕기 위해 친구 한명을 통해 다음 예시를 하나 생각해 보겠습니다. 친구의 이름은 김유겸이라고 하겠습니다. 어떠한 모집단에 대하여 유겸이가 해당 모집단의 평균은 A라고 주장하고 있습..

[확률과 통계] - (23) 불편추정량 (Unbiased estimator) (feat. 표본분산을 n-1로 나누는 이유)

2022.06.01· 🖥 Computer Science/확률과 통계

Biased(편의) 편의는 다음과 같이 정의됩니다. 편의 = 추정량의 기댓값 - 모수 예를 들어 대표적인 추정량인 표본평균에 대한 편의를 구해보겠습니다. 표본평균의 기대값은 다음과 같습니다. 표본평균은 다음과 같으므로 $$\overline{X_n} = \frac{1}{n}\sum^{n}_{i=1}X_i$$ 표본평균의 평균은 다음과 같습니다. $$E(\overline{X_n})=\frac{1}{n}\cdot E(X_1+X_2+\cdots +X_n) $$ $$=\frac{1}{n}\cdot (E(X_1)+E(X_2)+\cdots +E(X_n ))$$ $$=\frac{1}{n}\cdot n \cdot E(X_1)$$ $$= \frac{1}{n} \cdot n \cdot \mu = \mu $$ 즉 표본평균(추정..

[확률과 통계] - (22) 신뢰구간(Confidence Intervals)

2022.05.31· 🖥 Computer Science/확률과 통계

지금까지 저희가 배운 카이제곱분포와 t분포를 통해, 모수(모평균, 모분산)을 추정할 수 있다고만 하였지 실제로 하는 방법은 모른 체 넘어갔습니다. 이제부터는 이 두 분포를 사용하여 모평균과 모분산을 추정하는 방법에 대해서 알아보겠습니다. 그전에 우선 지금까지 배웠던 카이제곱분포와 T분포에서 중요한 것을들 정리하고 넘어가겠습니다. T 분포 모평균을 추정할 때 사용합니다. 정규분포를 따르는 확률변수를 정규화할 때, σ(모분산) 대신 σ'을 사용하여 정규화한다면 U와 같아지며, 따라서 정규화된 분포는 SND에서 자유도가 n-1인 t 분포로 바뀝니다. $$Z = \frac{(\overline{X}_n-\mu)}{\frac{\sigma}{\sqrt{n}}} \; \sim \; N(0, 1^{2})$$ $$\fra..

[확률과 통계] - (21) t 분포 (스튜던트 t 분포) (t Distribution)

2022.05.24· 🖥 Computer Science/확률과 통계

(스튜던트) T 분포 (Student t-distribution) 이전에 배웠던 카이제곱 분포는 표본들의 통계량을 통해서, 모집단의 분산을 추정하는데 사용되었습니다. 그러면 모집단의 평균은 무엇으로 추정할 수 있을까요? 이번에 배울 T분포를 통해 모집단의 평균을 추정할 수 있습니다. T분포는 스튜던트 T 분포, 학생 T 분포 등으로 불리며, 표본분산을 이용하여 정규분포를 따르는 모집단의 평균을 추정할 때 주로 사용되는 분포입니다. 모평균에 대한 신뢰구간이나 가설검정에서 사용됩니다. T 분포의 정의 두개의 독립인 확률변수 Y , Z를 다음과 같이 정의할 때, $$Y\; \sim \; \chi^{2}(m)$$ $$Z \; \sim \; N(0, 1^{2})$$ 확률변수 X를 다음과 같이 정의하면 $$X = ..

[확률과 통계] - (20) 표본 평균과 표본 분산의 결합분포

2022.05.24· 🖥 Computer Science/확률과 통계

$X_1$, ..., $X_n$이 평균 $\mu$와 분산 $\sigma^2$가 알려지지 않은 정규분포로부터 임의추출된 표본들이라 할 때, 평균 $\mu$와 분산 $\sigma^2$에 대한 최대가능도 추정량 (M.L.E)는 다음과 같습니다. $$\hat{\mu} = \overline{X_n}$$ $$\hat{\sigma^2} = \frac{\sum^{n}_{i=1}(X_i - \overline{X_n})^{2}}{n}$$ 지금부터는 이러한 두 추정량(estimator)에 대한 결합분포(joint distribution)를 유도해 보겠습니다. 저희는 이미 정규분포로부터 임의추출한 표본평균은 그 자체로 정규분포를 따르는 것을 알고 있습니다. (중심극한정리에 의해가 아닙니다.) $$\overline{X_n} \..

[확률과 통계] - (19) 카이제곱 분포 (Chi-Square Distribution)

2022.05.23· 🖥 Computer Science/확률과 통계

카이제곱 분포카이제곱 분포를 배우기 전에 카이제곱 분포를 왜 배우는지, 어떨 때 사용하는지 알아보겠습니다.카이제곱 분포는 표본들의 평균과 분산을 통해,정규분포를 따르는 모집단의 분산, 즉 모분산을 추정할 때 사용합니다. 이전에도 말씀드렸다싶이, 저희의 목적은 표본들을 가지고 모수를 추정하거나, 모수에 대한 가설을 검정하는 것이었습니다. 그중 모집단의 분산을 추정하는 방법에 사용되는 것이 바로 카이제곱분포입니다. 맛보기로 어떻게 추정이 가능한지 살펴보겠습니다.(카이제곱 분포의 자유도라던가, 식이 도출되는 과정은 생략하고, 추정이 가능한 이유에 대해서만 살펴보겠습니다.)우선 다음은 자유도 n인 카이제곱 분포를 의미합니다. 각 자유도에 대한 카이제곱분포는 이미 구해져있으며, 대부분 표로 주어집니다.$$\..

[확률과 통계] - (18) 통계량(statistic)과 표본분포(Sampling Distribution)

2022.05.23· 🖥 Computer Science/확률과 통계

통계의 목적 결국 저희가 통계를 통해 얻고자 하는 것은 다음과 같은 것들일 것입니다. "표본들이 이랬으니 모집단의 평균은 얼마일거야!" "쟤가 모집단의 평균이 A일거라 주장했는데 표본을 보니 A일수가 없겠는걸?" 첫번째 경우는 모수에 대한 "추정"을 하는 것이고 두번째 경우는 가설에 대한 "검정"을 하는 것입니다. 어떤 상황이든, 저희는 모집단을 전수조사 할 수 없어서 표본들을 조사합니다. 조사한 표본들을 통해 통계를 내고, 이를 통해 모집단을 추정, 혹은 검정을 진행합니다. 앞으로 배울 내용은 표본들을 추출하여 통계를 내었을 때 그려지는 분포와 이들의 속성을 배울 것입니다. 이전에 배운 중심극한정리는 표본의 수가 커지면 표본평균은 정규분포에 수렴한다는 내용이었고, M.L.E 는 관찰된 확률변수들, 즉 ..

티스토리툴바