:: ADVANCE ::
[확률 및 통계학] Ch 7. 신뢰구간 본문
Ch 7. 신뢰구간
미지의 모수의 값을 추정하기 위해 표본 통계량을 사용하여 통계적 추론을 한다.
표본의 크기가 30이상 이거나 모집단이 정규분포를 따르면서 표준편차 σ를 알 때
모수 μ에 대한 추정을 하기 위해 표본통계량을 사용한다.
통계학에서는 모집단으로부터 표본을 추출하고, 추출된 통계량(표본평균, 표본표준편차)을 통해
모수(모평균, 모표준편차)를 추정하고자 하는 학문이다. 이를 점추정(point estimate)라고 한다.
하지만 점추정만으로는 모수가 얼마나 정밀하게 추정되었는지 알 수 없으므로 존재할 구간을
확률적으로 추정하는 구간추정(interval estimate)이 동시에 사용될 수 있다.
자료의 표본평균을 구하면 되는 듯하다.
즉 점추정값에서 하나의 μ를 구하였지만 모평균이 구하여진 μ값일 확률은 사실상 0이다.
따라서 우리는 μ가 포함된 구간을 추정한다.
대표적인 구간추정이 신뢰구간(confidence interval; CI)이다.
신뢰구간이란 이 구간 내에 실제 모수가 존재할 것으로 예측되는 구간으로 정의되며,
90%, 95%, 99% 신뢰구간 등 다양한 정도의 구간추정이 가능하다.
이 중 대표적으로 보건의학 통계 분야에서 가장 널리 사용되고 있는 것은 95% 신뢰구간이다.
이는 예측된 구간 내에 실제 모평균이 있을 가능성이 95%라고 신뢰할 수 있는 구간의 의미로
(구간의 시작, 구간의 끝)의 형식으로 표현된다.
점 추정값을 구간의 중심에 놓고 오차의 한계를 더하거나 빼줘서 구간을 정한다.
이 오차의 한계를 정하는 것이 95%, 99%신뢰구간이다.
모평균에 대한 신뢰구간
연속형 자료의 경우 표본의 크기(표본수)가 충분히 크다면
중심극한의 정리에 의해 표본 평균이 정규분포를 따른다고 가정할 수 있다.
그리고 이 정규분포라는 가정 하에 표본 평균과 표본 표준편차로부터 모평균의 신뢰구간을 구할 수 있다.
표본의 크기가 n인 표본집단의 평균이 X, 표준편차가 s라면, 모평균의 95% 신뢰구간은
만약 표본들의 평균과 표준편차가 비슷하다면, 95% 신뢰구간의 폭은 표본수에 영향을 받는다.
표본수가 클수록 모평균은 정밀하게 추정될 수 있으며,
표본수가 작다면 신뢰구간이 너무 넓어 모평균이 실제로 어디쯤에 위치할지 예측하기 어렵다.
'Study > 확률과 통계' 카테고리의 다른 글
[확률 및 통계학] Ch 6.6 이항분포의 정규근사 2 (0) | 2014.10.02 |
---|---|
[확률 및 통계학] Ch 6.6 이항분포의 정규근사 1 (0) | 2014.10.01 |
[확률 및 통계학] Ch 6. 중심극한 정리 (0) | 2014.09.30 |
[확률 및 통계학] Ch 6. 표준정규분포 (0) | 2014.09.30 |
[확률 및 통계학] Ch 6. 정규분포 (0) | 2014.09.30 |