'비례배분'에 해당되는 글 1건

  1. 2017.04.03 25. 층화임의추출

본추출의 개요

표본추출의 종류

단순임의추출

이번 시간에는 확률표본추출방법 중 층화임의추출법에 대해 알아 보겠습니다. 층화임의추출법(stratified random sampling)은 모집단을 몇 개의 이질적인 층(stratum)으로 구분하여 각 층별로 임의추출법을 적용하는 방법입니다. 층화임의추출법은 비확률표본추출방법 중 하나인 할당표본추출(quota smapling)과 구분해야 합니다. 할당표본추출은 편향된 표본을 추출하지 않도록 모집단의 특성에 비례하여 표본을 추출하는 방법입니다. 최종 조사집계표만 본다면 할당표본추출은 층화임의추출과 유사한 모습을 보이지만 확률표본추출을 적용하지 않는다는 점에서 층화임의추출과는 완전히 다른 표본추출방법입니다.

단순임의추출법과 층화임의추출법을 비교하기 위해 모분산을 층내분산과 층간분산으로 분해해 보았습니다. 동일 층의 이질성은 낮추고 서로 다른 층간의 이질성은 높아지도록 표본추출하는 층화임의추출법을 적용하게 되면 아래 수식의 앞 부분 즉 층내분산이 감소하게 되어 전체 분산이 줄어드는 효과가 있습니다. 최대허용오차-오차한계는 분산의 제곱근인 표준편차에 비례하고 표본크기의 제곱근에 반비례하므로 서로 다른 층의 이질성이 커지도록 층화임의추출법을 적용하게 되면 단순임의추출법에 비해 보다 정확한 표본추출이 가능해집니다.



층화임의추출법에서 각 층에 표본을 할당하는 배분방법에는 비례배분과 불비례배분이 있습니다. 불비례배분에는 네이만배분(Neyman allocation)과 데밍배분(Deming allocation)이 있습니다. 각각의 배분방법은 일정한 가정 하에서 최대허용오차를 제약조건으로 비용을 극소화하는 배분방법입니다.



비례배분은 각층별로 조사비용에 차이가 없고 분산 역시 동일할 경 각 층이 모집단에서 차지하는 비율에 비례하여 표본을 할당하는 방법입니다. 네이만배분은 전체 표본크기가 주어져 있고 각 층별로 조사단위별 변동비용이 동일한 경우 각 층의 표준편차와 각 층에 속하는 모집단 크기에 비례하여 표본을 할당하는 방법입니다. 마지막으로 데밍배분은 총 비용이 일정하게 주어져 있고 각 층별로 비용이 상이할 경우 각 층의 표준편차가 클수록, 각 층의 조사단위별 변동비용이 작을수록 보다 많은 표본을 할당하는 방법입니다.

층화임의추출법은 집단 간 이질성이 존재하는 경우 단순임의추출법보다 정확하게 모집단을 대표하는 표본을 추출할 수 있습니다. 다만, 집단을 구분하는 변수를 잘못 선정하면 오히려 표본의 대표성을 저해할 수 있습니다.

실제 설문조사에서는 층화임의추출법만을 적용하기 보다는 다른 표본추출방법과 결합하여 사용하는 것이 일반적입니다. 예를 들어 행정구역별로 주민 인구수에 비례하여 표본크기를 할당하고 일정 간격에 따라 조사대상 가구를 추출하게 되면 행정구역별로 단순임의추출법을 적용한 것과 유사한 효과를 기대할 수 있습니다.

층화임의추출법에서 각 층의 모집단 크기나 분산을 사전적으로 알 수 없는 경우가 많습니다. 모집단에 대한 추론을 위해 표본을 추출하는데 모집단에 대한 정보를 알아야 한다는 모순이 있는 것입니다. 결국 조사의 반복이라는 경험을 통해 선험적 모순을 극복하려는 노력이 필요함을 알 수 있습니다.


궁금하신 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변드리겠습니다! 

                           




Posted by dooka
,