:: ADVANCE ::

[확률 및 통계학] Ch 7. 신뢰구간 본문

Study/확률과 통계

[확률 및 통계학] Ch 7. 신뢰구간

KSJ14 2014. 10. 2. 01:33
반응형

Ch 7. 신뢰구간

 

 미지의 모수의 값을 추정하기 위해 표본 통계량을 사용하여 통계적 추론을 한다.

표본의 크기가 30이상 이거나 모집단이 정규분포를 따르면서 표준편차 σ를 알 때

모수 μ에 대한 추정을 하기 위해 표본통계량을 사용한다.

 

 통계학에서는 모집단으로부터 표본을 추출하고, 추출된 통계량(표본평균, 표본표준편차)을 통해

모수(모평균, 모표준편차)를 추정하고자 하는 학문이다. 이를 점추정(point estimate)라고 한다.

하지만 점추정만으로는 모수가 얼마나 정밀하게 추정되었는지 알 수 없으므로 존재할 구간을

확률적으로 추정하는 구간추정(interval estimate)이 동시에 사용될 수 있다.

 

 

 

자료의 표본평균을 구하면 되는 듯하다.

 

       즉 점추정값에서 하나의 μ를 구하였지만 모평균이 구하여진 μ값일 확률은 사실상 0이다.

따라서 우리는 μ가 포함된 구간을 추정한다. 

 

  대표적인 구간추정이 신뢰구간(confidence interval; CI)이다.

신뢰구간이란 이 구간 내에 실제 모수가 존재할 것으로 예측되는 구간으로 정의되며,

90%, 95%, 99% 신뢰구간 등 다양한 정도의 구간추정이 가능하다.

이 중 대표적으로 보건의학 통계 분야에서 가장 널리 사용되고 있는 것은 95% 신뢰구간이다.

이는 예측된 구간 내에 실제 모평균이 있을 가능성이 95%라고 신뢰할 수 있는 구간의 의미로

(구간의 시작, 구간의 끝)의 형식으로 표현된다.

점 추정값을 구간의 중심에 놓고 오차의 한계를 더하거나 빼줘서 구간을 정한다.

이 오차의 한계를 정하는 것이 95%, 99%신뢰구간이다.

 

 

모평균에 대한 신뢰구간

 

 연속형 자료의 경우 표본의 크기(표본수)가 충분히 크다면

중심극한의 정리에 의해 표본 평균이 정규분포를 따른다고 가정할 수 있다.

그리고 이 정규분포라는 가정 하에 표본 평균과 표본 표준편차로부터 모평균의 신뢰구간을 구할 수 있다.

표본의 크기가 n인 표본집단의 평균이 X, 표준편차가 s라면, 모평균의 95% 신뢰구간은

 

 

 만약 표본들의 평균과 표준편차가 비슷하다면, 95% 신뢰구간의 폭은 표본수에 영향을 받는다.

표본수가 클수록 모평균은 정밀하게 추정될 수 있으며,

표본수가 작다면 신뢰구간이 너무 넓어 모평균이 실제로 어디쯤에 위치할지 예측하기 어렵다.

   

 

 

 

 

 

 

[참고]     http://dermabae.tistory.com/184

반응형
Comments