신뢰구간을 이용한 추정의 의미를 이해했으므로 본격적인 통계적 의사결정이라고 할 수 있는 검정 과정에 대해 알아보겠습니다. 표본으로부터 얻은 정보를 이용해 미지의 모수에 대한 주장의 옳고 그름을 판단하는 가설검정 과정 역시 모집단 정보의 일부만을 활용하는 표본조사라는 개념과 밀접한 관련이 있습니다.
다음 사례를 통해 표본조사를 이용한 가설 검정의 기본원리에 대해 살펴보겠습니다. 가상의 시장에서, 어떤 기업이 지금까지의 경험을 통해 제품 컨셉트에 대한 호감도가 10점 만점 기준 7점 이상이면 해당 컨셉트의 제품을 출시할 경우 성공할 가능성이 매우 높고, 가상의 시장에 속하는 소비자 집단 전체의 호감도 모분산 σ2은 반복되는 선행조사를 통해 대략 4 정도 된다는 점을 알고 있다고 해보겠습니다. 이 제품의 마케팅 담당자는 독립적으로 동일한 분포를 따르는 확률표본 100명을 추출해서 표본의 제품 컨셉트에 대한 평균 호감도 값이 7보다 크면 해당 컨셉트의 신제품 개발에 착수하고 그렇지 않으면 기존 제품의 마케팅 활동을 강화하기로 결심했습니다.
확률표본 100명을 기준으로 모평균이 7일 때 확률 에서 가능한 표본평균의 범위를 추정해보면, 표본추출을 반복할 경우 표본평균이 7+Z0.05×(2/10)=7+1.64×(2/10)=7+0.328≑7.33 범위 내에 있을 확률이 95%임을 알 수 있습니다. 만약 표본평균의 값이 7.5점이라면 신뢰수준 95% 하에서는 일어날 확률이 희박한 사건이 발생했다고 볼 수 있고, 모평균이 7점보다 클 가능성이 높다고 보아 신제품 개발에 착수하는 것이 합리적입니다. 그러나 표본평균값이 7.1점이라면 모평균이 7점인 경우에도 충분히 발생 가능한 사건이기 때문에 신제품 개발을 다시 한 번 생각해보야 할 것입니다.
여기에서 제품 컨셉트에 대한 호감도가 7보다 크다는 주장을 기존 상태에 대립하는 주장이라는 뜻에서 대립가설이라고 하고 제품 컨셉트에 대한 호감도가 7보다 작거나 같다는 주장과 같이 강력한 증거를 통해 가설검정의 직접적 대상이 되는 가설을 귀무가설이라고 합니다. 대범하게 말하면 일반적으로 현재 상태를 옹호하는 주장, 혹은 현재의 상태에서 별도의 조치가 필요없은 주장이 귀무가설이 되는 경우가 많습니다.
그런데 통계적 추정 과정에서는 주어진 표본을 근거로 가장 그럴듯한-발생가능성이 높은 모수의 범위를 추론하므로 비록 모수가 미지이지만 그 미지의 모수에 대한 단 하나의 확률분포만을 생각하면 되지만 가설 검정에서는 가능한 모수의 범위가 거의 무한대에 가깝기 때문에 고려해야할 확률분포 역시 무한대에 가깝습니다. 그러므로 이러한 난점을 고려해 주어진 표본의 정보를 바탕으로 최대한 합리적인 의사결정 준칙을 마련할 필요가 있습니다. 이를 위해서는 제1종 오류(type I error)와 제2종 오류(type II error)에 대해 알아보아야 합니다. 다음 시간에는 제1종 오류와 제2종 오류를 출발점으로 가설 검정에 대해 좀 더 자세하게 알아보겠습니다.
궁금하신 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변 드리겠습니다!