정규분포의 표본분포 중 하나인 t-본포에 대해 알아보겠습니다. 통계분석 프로그램에서 가설검정을 흔히 t-검정이라고 지칭하고 있습니다. 그렇게 명명하는 이유는 정규분포와 t-분포 사이에 밀접한 관계가 있기 때문입니다. 만약 모집단 분포가 정확하게 정규분포를 따른다고 하면 표본평균을 표준화한 변수 Z에서 모집단의 분산을 제곱근한 표준편차 대신 표본의 표준편차를 대입한 새로운 변수 T는 자유도 n-1인 t분포를 따릅니다.

t분포는 정규분포와 마찬가지로 좌우대칭의 형태를 이루고 있으나 정규분포에 비해 극단치에 민감하여 정규분포에 비해 두꺼운 꼬리를 가지고 있습니다. 또한, t분포는 기본적으로 정규분포 모집단에서 표본크기가 작은 경우에 적용하기 위한 분포로서 표본크기가 증가하면 t분포는 정규분포에 근사합니다. t-분포는 정규분포 모집단의 표본분포이므로 t분포를 적용하기 위해서는 표본의 확률변수들의 분포가 정규분포에 적합해야 합니다.

우리는 앞에서 확률표본에서 표본크기가 증가하면 중심극한정리에 의해 근사적으로 Z는 평균이 0이고 분산이 1인 표준정규분포를 따름을 알았습니다. 그런데 표본크기가 증가하면 표본의 표준편차가 모집단의 표준편차에 근사하므로 모집단의 표준편차 대신 표본의 표준편차를 대입한 변수 역시 근사적으로 표준정규분포를 따르게 됩니다. 아래에서 A는 aymptotic의 약자로 근사적으로 해당 분포를 따른다는 의미입니다.

정규분포 모집단에서 표본크기가 작은 경우에는 t분포를 따르게 되고 표본크기가 증가하게 되면 t분포는 정규분포에 근사하므로 통계분석 프로그램에서는 구태여 정규분포에 근거한 검정과 t분포에 근거한 검정을 구분할 필요가 없습니다. 시장조사론 교재에서도 별 다른 구분 없이 t검정으로 통칭하는 경우가 많습니다. 물론 통계학 교재에서는 두 가지 경우를 준별하고 있습니다.

 

궁금한 점이 있으면 아래 버튼을 클릭해 주십시오. 데이터테일즈가 성실하게 답변 드리겠습니다. 

                                                     

 

 

Posted by dooka
,