'기각역'에 해당되는 글 2건

  1. 2017.09.11 41. p-value
  2. 2017.09.04 38. 가설검정③

41. p-value

야행하는 리서치 2017. 9. 11. 09:00

귀무가설의 채택 여부를 결정하는 기준으로 통계분석프로그램에서 흔히 제시되는 값으로p-value가 입니다. p-value는 유의확률(significance probability)라고도 하는데, p-value는 검정통계량의 결과값에 대해 귀무가설을 기각할 수 있는 최소한의 유의수준을 말합니다. 만약 보다 작은 유의수준으로 귀무가설을 기각할 수 있다면 검정통계량의 결과값은 귀무가설 하에서 발생가능성이 보다 희박한 사건이 될 것이므로 p-value 값이 작을수록 대립가설에 대한 보다 강력한 증거가 됩니다. 즉 p-value는 설문조사의 결과가 대립가설을 반대하는 입증정도를 나타냅니다.

이미 주어진 유의수준 하에서 기각역을 계산할 수 있음에도 p-value를 제시하는 이유는 표본크기가 커질수록 표본의 표준편차 즉 표준오차가 작아지므로 미세한 차이도 구분이 가능해지고 실제 귀무가설이 참이건 거짓이건 상관없이 대부분의 경우에 귀무가설을 기각할 수 있기 때문입니다. 이러한 문제를 해결하기 위해 획일적인 유의수준을 제시하지 않고 의사결정자가 의사결정에 따른 오류 가능성을 어느 정도 받아 들이지에 따라 스스로 귀무가설의 기각여부를 판단할 수 있도록 p-value를 제시합니다.

 

궁금한 점이 있으면 아래 버튼을 클릭해 주십시오. 데이터테일즈가 성실하게 답변 드리겠습니다.

                                                     

 

 

Posted by dooka
,

36. 가설검정 ①

37. 가설검정 ②

지금까지 통계적 가설검정의 원리를 이해했으므로 관련 개념 및 기본원리와 통계적 가설검정의 일반적인 절차를 정리해 보겠습니다.

            

 

 

이제 지지율에 대한 가설검정 사례를 통해 통계적 가설검정 절차를 일별해 보겠습니다. 광역지방자치단체장을 선출하는 선거에 출마한 특정 후보의 선거운동본부에서는 해당후보의 지지율이 20%를 넘어가는지 여부에 따라 홍보전략을 달리 하기로 했고 해당 광역지방자치단체 유권자 전체로부터 확률표본 400명을 추출했다고 가정해보겠습니다. 귀무가설은 지지율 p가 20%보다 작은 것으로, 대립가설은 지지율 p가 20%보다 큰 것으로 설정하고 귀무가설 하에서 지지율의 표본분포를 구해보면 지지율은 근사적으로 평균이 0.2이고 분산이 0.2×(1-0.8)/400=0.0004인 정규분포에 근사합니다.

 

유의수준 5% 하에서 만족하는 c값을 구하고 표본으로부터 구한 지지율이 c값보다 크면 귀무가설을 기각하는 의사결정을 내리면 됩니다. (c-0.2)/=z0.05 = 1.64에서 c값을 구하면 0.233입니다. 만약 표본으로부터 구한 지지율이 23.3%보다 크다면 모집단 지지율 20%이하일 경우 매우 희귀한 사건이라고 할 수 있으므로 귀무가설을 기각할 수 있는 강력한 증거가 됩니다.

이와 같이 부등호가 한쪽 방향으로 설정되어 표본분포의 한쪽 꼬리에 기각역을 정하는 가설검정을 단측검정이라고 합니다. 만약 위 지지율 사례에서 귀무가설을 지지율 20%와 같다라고 설정하면 표본분포의 양쪽 꼬리에 기각역을 정하는 양측검정이 됩니다. 위 지지율 사례에서 지지율은 20%라는 귀무가설에 대해 표본의 지지율이 -c보다 작거나 c보다 크면 귀무가설을 기각한다고 해보겠습니다. 양측검정인 귀무가설 하에서는 아래의 수식이 성립합니다.

여기에서 아래의 등식을 -c와 c에 대해 정리하면 -c=0.161, c=0.239 입니다. 표본의 지지율이 16.1%보다 작거나 23.9%보다 크다면 지지율은 20%라는 귀무가설을 기각할 강력한 증거가 됩니다.

정확한 분석을 통해 의사결정의 품질을 높이고 싶으시다면 데이터테일즈와 상담해 보세요.

                                       

 

 

 

 

Posted by dooka
,