문제 3 변수간의 관계를 파악하는 분석(사례: 연령별로 선호하는 영화장르 분석)에서 명목척도나 서열척도로 측정된 변수의 분포에 차이가 있는지를 파악하는 교차분석을 위하여 카이자승(X2)검정을 할 수 있다. 카이자승검정을 위하여 2개의 범주형 변수들 간의 교차분석표(cross-tabulation table)를 설명하고 카이자승 검정의 통계량을 산출하기 위해 비교하는 두 수치를 설명하시오.(10

 

문제 解說 3번 문제는 통계적 의사결정과정과 교차분석에서의 카이자승검정의 절차를 이해하고 있다면 큰 무리 없이 답변이 가능한 문제입니다.

카이자승(X2)검정통계량을 이용한 교차분석은 범주형 자료 즉 명목척도 또는 서열척도 변수의 관련성에 대한 분석입니다. 문제에서 연령별로 선호 영화장르의 비율에는 차이가 없다는 주장을 귀무가설로 설정한다면 귀무가설 하에서는 연령별 선호 영화장르 비율은 동일하고 이는 전체 연령집단에서도 동일한 비율로 나타날 것입니다.

귀무가설 하에서는 연령별 선호영화장르의 출현 빈도는 동일한 선호영화장르 출현 비율을 가지는 다항분포를 따르게 되고 그 결과 실제 관측도수와 귀무가설 하의 비율을 근거로 산출한 기대도수의 차이의 제곱합을 영화장르별 기대도수로 나눈 값의 합은 카이자승분포를 따르게 됩니다.

 

실제 관측도수와 귀무가설 하의 비율을 근거로 산출한 기대도수의 차이의 제곱합은 교차분석에서의 검정통계량이 되고 이 검정통계량의 관측치를 카이자승분포 하의 임계치와 비교하여 검정통계량의 관측치가 주어진 유의수준 하에서의 임계치보다 큰 값이라면 귀무가설 하에서는 극단적인 값이 나온 것으로 볼 수 있기 때문에 귀무가설을 유지할 수 없고 연령별로 선호 영화장르는 차이가 있다고 할 수 있습니다.

 

연령별 선호 영화장르 사례에 대한 자료구조를 파악하기 위해 교차분석표를 임의로 구성해 보았습니다. 10~40대 연령 응답자 총 1,600명을 대상으로 조사한 경우를 생각해보겠습니다. 10대는 279, 20대는 338, 30대는 527, 40대는 456명을 할당했습니다. 실제 설문조사를 진행했다고 가정하고 가상의 관측도수에 근거한 교차분석표를 아래와 같이 만들어 보았습니다.



이제 귀무가설 하에서는 5개 영화 장르별 선호비율은 각각 43.4%, 20.1%, 16.1%, 8.2%, 12.2%로 연령별로 동일하다고 가정해 보겠습니다. 이에 근거한 기대도수를 반영한 교차분석표는 아래와 같습니다. 10대 고어/슬래셔 장르를 예로 들면 10대에 할당한 표본크기 279×43.4%를 곱하여 기대도수를 산출하면 됩니다.


 




검정통계량의 구체적인 값은 (200-121)2/121+(50-56)2/56+(60-45)2/45+ +(72-56)2/56 = 2,013이 됩니다. 귀무가설

하에서는 검정통계량의 표본분포는 자유도 (5-1)×(4-1)=12의 카이자승분포이므로 유의수준을 5%로 설정한다면 본 사례에서의 임계치는 21.03입니다. 그러므로 사례의 검정통계량 값은 주어진 귀무가설 하에서는 매우 극단적인 값으로 귀무가설에 대한 강력한 반증이 되고 연령별 선호 영화 장르에는 차이가 있다고 판단할 수 있습니다.


문제 4 실험디자인(실험설계)의 타당성 개념과 유형을 설명하고, 실험디자인(실험설계)의 타당성 유형들의 관계를 외생변수와 관련하여 설명하시오. (10)

 

문제 解說 실험설계의 타당성에는 내적 타당성과 외적 타당성, 구성개념적 타당성, 통계적 타당성이 있습니다. 문제는 실험설계의 타당성 중 내적 타당성과 외적 타당성의 관계를 묻는 것으로 보입니다.

 

내적 타당성이란 조사의 설계와 분석이 원인과 결과 즉 인과관계를 정확하게 추론하는 정도를 말합니다. 내적 타당성을 저해하는 외생변수로는 조사대상집단의 특성변화와 관련한 성숙요인과 역사적 요인이 있고, 표본의 대표성과 관련한 선발요인, 상실요인 및 회귀요인이 있습니다. 관찰 및 측정방법과 관련해서는 검사요인과 측정수단이 문제가 됩니다.

 

외적 타당성은 조사의 분석결과를 일반화시킬 수 있는 범위를 말합니다. 외적 타당성에서는 특히 다른 모집단에 대한 일반화, 일반화가 가능한 시기 및 일반화가 가능한 상황이 문제가 됩니다.


조사대상집단의 특성 변화 측면에서 본다면 조사기간이 길어지면 내적 타당성이 저해될 우려가 있는 반면, 일반화의 가능성이 높아진다는 점에서 내적 타당성과 외적 타당성은 상충관계에 있다고 하겠습니다. 반면, 표본의 대표성과 관측 및 측정방법과 관련해서는 내적 타당성을 저해하는 여러 외생변수들이 외적 타당성까지 저해한다고 하겠습니다.






 

 


Posted by dooka
,

1/2. 내적 타당성(조사설계의 타당성)




조사설계의 타당성 혹은 내적 타당성이란 조사의 설계와 분석이 원인과 결과를 얼마나 정확하게 추론하는가와 관련된 개념입니다.

조사의 내적 타당성은 조사의 설계와 분석이 원인과 결과를 정확하게 추론하는 정도를 말합니다.

내적 타당성의 저해요인들은 크게 조사대상집단의 특성 변화와 관련된 요인들과 표본의 대표성을 저해하는 요인들, 마지막으로 측정

방법과 관련된 요인들이 있습니다.



설문조사 실무에서 특히 빈번하게 직면하게 되는 문제는 회귀요인과 검사요인 및 측정수단요인에 의한 내적 타당성의 저하입니다.

회귀요인을 극복하기 위해서는 최대한 확률추출에 근접할 수 있도록 다양한 조사대상자를 확보하기 위해 노력하는 한편, 표본의 크기

를 확대하고 조사의 시행 횟수를 늘려야 하는데 현실은 그렇지 않다는 점에서 문제가 있습니다. 당장 예산상의 제약 때문에 비정기적

인 단발성 조사를 시행할 수 밖에 없다면 단 한번의 설문조사로 나온 결과를 마치 절대적이고 최종적인 결과로 오인해서는 안됩니다.

또한, 가능한 방법으로 추가정보를 수집해서 자료가 일관성이 있는지 파악해야 합니다. 


동일 설문으로 반복해서 시행하게 되는 목적성 패널 조사에서는 응답자들이 설문조사 자체에 익숙해져서 편향된 응답을 하는 경우가

빈번합니다. 보통 세 번째 참여부터 비정상적인 자료의 출현이 급속도로 증가하고 응답률도 떨어지게 됩니다. 이때 최대한 동일한 특

성을 지니고 있는 응답자로 표본을 대체해야 하는데 완전히 동일한 응답자를 찾는 것은 사실상 불가능합니다.


측정수단요인 역시 흔하게 직면하게 되는 문제인데 환경변화에 맞추어 설문을 변경해야 하는 경우 선행 자료와의 비교가능성을 고려

하지 않을 수 없습니다. 보통은 동일한 내용을 이전 설문 형태와 현재 설문행태로 반복해서 질문하게 되는데, 그럴 경우 설문지 분량이

늘어나 설문 참여자의 불성실응답 가능성도 높아지게 됩니다.  


2/2. 외적 타당성

외적 타당성이란 조사 결과를 일반화시킬 수 있는 범위와 관련된 개념입니다. 외적 타당성의 제약요인으로는 다른 모집단에 대한 적용

가능성과 일반화 가능한 시기, 일반화가 가능한 상황의 문제가 있습니다.


설문조사에서 연령별로 할당량을 주는 것 역시 일반화 가능한 시기의 문제를 극복하기 위한 노력입니다. 구매의향이나 구매경험에 더

불어 그 시기를 질문함으로써 자료의 신뢰성을 점검할 뿐만 아니라 조사시기와 현재 의사결정 시기와의 시간적 괴리를 감안할 수 있게

됩니다. 흔히 신제품 출시 후 시장에서의 반응을 점검할 때 전국조사가 어려운 경우, 우리나라 전체 구성과 흡사한 도시를 찾아 조사를

진행하기도 하는데 이는 일반화가 가능한 상황에서의 결과를 얻기 위한 노력이라고 하겠습니다. 일면 서로 반대되는 표본추출방법처

럼 보이는 층화추출과 집락추출이 사실은 주어진 상황 하에서 외적 타당성을 높이기 위한 방편이었음을 엿볼 수 있습니다 












 



Posted by dooka
,