'통계적 추정'에 해당되는 글 1건

  1. 2017.07.26 34. 통계적 추정의 기본원리①

통계적 의사결정 과정에는 모집단에 대한 정보가 없는 상태에서 표본으로부터 얻은 정보를 이용해 모집단의 특징을 나타내는 대표값인 미지의 모수를 예측하는 추정 과정과 표본으로부터 얻은 정보를 이용해 미지의 모수에 대한 주장의 옳고 그름을 판단하는 가설검정 과정으로 구분해 볼 수 있습니다. 가설검정을 위해서는 먼저 모수를 예측하는 추정 과정이 필요하므로 먼저 통계적 추정과정에 대해 알아보겠습니다.

추정 과정에 대한 이해를 돕기 위해 총 5개의 개체로 이루어진 모집단을 생각해 보겠습니다. 모집단은 특정 제품군의 소비자 전체이고 각각의 호감도 값은 신규 출시 제품에 대한 7점 척도 응답이라고 해 보겠습니다. 우리는 표본을 추출해서 조사해보기 전까지는 모집단에 속하는 개체의 호감도를 알 수 없고 모집단의 평균도 알지 못합니다.

이제 동일한 확률로 복원추출을 통해 아이디 3번, 4번, 5번을 표본으로 얻었다면 표본평균 값은 (4+6+6)/3=5.3이 됩니다. 우리가 알고 있는 정보는 표본을 통해 얻은 표본평균 값이 전부이므로 표본평균 값을 모집단 평균으로 추정할 수밖에 없습니다. 이렇게 하나의 값으로 모수를 추측하는 것을 점추정이라고 합니다. 그런데 하나의 값으로 모수를 추론하는 점추정은 근본적인 문제가 있습니다. 모집단 정보의 일부인 표본의 정보를 이용해 추론하므로 표본으로 얻은 값이 관심 있는 모수와 정확히 일치할 가능성은 매우 낮다는 것이 그것입니다.  

 

                     

 

위 모집단을 근거로 가능한 표본평균의 분포(표본분포)를 구해보면 표본평균 값은 가능한 여러 가지 가능성 중 하나에 불과함을 알 수 있습니다. 우리는 표본평균의 평균이 모평균이라는 사실과 표본평균이 모평균을 중심으로 일정한 분포를 따른다는 사실은 알고 있지만 구체적인 모평균의 값은 알 수 없습니다. 구체적인 표본평균 값은 모평균과는 상당한 차이가 있을 가능성도 있습니다.

아래 예시 표본분포를 살펴보면 직관적으로 보더라도 모평균 5와는 다소 차이가 있어 보이는 표본평균 4, 4.3, 5.7, 6 중 하나의 표본이 추출될 확률이 32%에 육박하여 모평균에 대한 추론이 잘못될 가능성이 상당함을 알 수 있습니다. 그러므로 모집단 정보를 일부만 이용하는 표본조사 과정에 비추어 볼 때 일의적인 하나의 표본평균 값으로 모평균을 추론한다는 것은 매우 불합리한 방법일 수 있습니다.

우리는 표본추출을 반복할 경우 그 결과가 얼마나 신뢰할 수 있는지를 나타내는 신뢰수준과 표본추출을 반복함에 따라 모집단의 특성치(모평균)를 표본통계량(표본평균)이 얼마나 오차 없이 반영하는지를 나타내는 오차한계가 주어질 때, 최소 표본크기를 산정하는 방법에 대해 알아보았습니다. 다음 시간에 주어진 신뢰수준 하에서 우리가 관심 있는 모집단의 특성치(모평균)를 어떻게 추정할 것인지 좀 더 구체적으로 알아보겠습니다.

매우 낮다는 점이 그것입니다

31. 표본크기의 결정

 

궁금하신 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변 드리겠습니다!

                                            

 

 

'야행하는 리서치' 카테고리의 다른 글

36. 가설검정①  (0) 2017.08.18
35. 통계적 추정의 기본원리②  (0) 2017.08.02
33. 설문지의 순서배열  (0) 2017.07.20
32. 설문지 작성 방법  (0) 2017.07.17
31. 표본크기의 결정  (0) 2017.05.11
Posted by dooka
,