문제 3 변수간의 관계를 파악하는 분석(사례: 연령별로 선호하는 영화장르 분석)에서 명목척도나 서열척도로 측정된 변수의 분포에 차이가 있는지를 파악하는 교차분석을 위하여 카이자승(X2)검정을 할 수 있다. 카이자승검정을 위하여 2개의 범주형 변수들 간의 교차분석표(cross-tabulation table)를 설명하고 카이자승 검정의 통계량을 산출하기 위해 비교하는 두 수치를 설명하시오.(10

 

문제 解說 3번 문제는 통계적 의사결정과정과 교차분석에서의 카이자승검정의 절차를 이해하고 있다면 큰 무리 없이 답변이 가능한 문제입니다.

카이자승(X2)검정통계량을 이용한 교차분석은 범주형 자료 즉 명목척도 또는 서열척도 변수의 관련성에 대한 분석입니다. 문제에서 연령별로 선호 영화장르의 비율에는 차이가 없다는 주장을 귀무가설로 설정한다면 귀무가설 하에서는 연령별 선호 영화장르 비율은 동일하고 이는 전체 연령집단에서도 동일한 비율로 나타날 것입니다.

귀무가설 하에서는 연령별 선호영화장르의 출현 빈도는 동일한 선호영화장르 출현 비율을 가지는 다항분포를 따르게 되고 그 결과 실제 관측도수와 귀무가설 하의 비율을 근거로 산출한 기대도수의 차이의 제곱합을 영화장르별 기대도수로 나눈 값의 합은 카이자승분포를 따르게 됩니다.

 

실제 관측도수와 귀무가설 하의 비율을 근거로 산출한 기대도수의 차이의 제곱합은 교차분석에서의 검정통계량이 되고 이 검정통계량의 관측치를 카이자승분포 하의 임계치와 비교하여 검정통계량의 관측치가 주어진 유의수준 하에서의 임계치보다 큰 값이라면 귀무가설 하에서는 극단적인 값이 나온 것으로 볼 수 있기 때문에 귀무가설을 유지할 수 없고 연령별로 선호 영화장르는 차이가 있다고 할 수 있습니다.

 

연령별 선호 영화장르 사례에 대한 자료구조를 파악하기 위해 교차분석표를 임의로 구성해 보았습니다. 10~40대 연령 응답자 총 1,600명을 대상으로 조사한 경우를 생각해보겠습니다. 10대는 279, 20대는 338, 30대는 527, 40대는 456명을 할당했습니다. 실제 설문조사를 진행했다고 가정하고 가상의 관측도수에 근거한 교차분석표를 아래와 같이 만들어 보았습니다.



이제 귀무가설 하에서는 5개 영화 장르별 선호비율은 각각 43.4%, 20.1%, 16.1%, 8.2%, 12.2%로 연령별로 동일하다고 가정해 보겠습니다. 이에 근거한 기대도수를 반영한 교차분석표는 아래와 같습니다. 10대 고어/슬래셔 장르를 예로 들면 10대에 할당한 표본크기 279×43.4%를 곱하여 기대도수를 산출하면 됩니다.


 




검정통계량의 구체적인 값은 (200-121)2/121+(50-56)2/56+(60-45)2/45+ +(72-56)2/56 = 2,013이 됩니다. 귀무가설

하에서는 검정통계량의 표본분포는 자유도 (5-1)×(4-1)=12의 카이자승분포이므로 유의수준을 5%로 설정한다면 본 사례에서의 임계치는 21.03입니다. 그러므로 사례의 검정통계량 값은 주어진 귀무가설 하에서는 매우 극단적인 값으로 귀무가설에 대한 강력한 반증이 되고 연령별 선호 영화 장르에는 차이가 있다고 판단할 수 있습니다.


문제 4 실험디자인(실험설계)의 타당성 개념과 유형을 설명하고, 실험디자인(실험설계)의 타당성 유형들의 관계를 외생변수와 관련하여 설명하시오. (10)

 

문제 解說 실험설계의 타당성에는 내적 타당성과 외적 타당성, 구성개념적 타당성, 통계적 타당성이 있습니다. 문제는 실험설계의 타당성 중 내적 타당성과 외적 타당성의 관계를 묻는 것으로 보입니다.

 

내적 타당성이란 조사의 설계와 분석이 원인과 결과 즉 인과관계를 정확하게 추론하는 정도를 말합니다. 내적 타당성을 저해하는 외생변수로는 조사대상집단의 특성변화와 관련한 성숙요인과 역사적 요인이 있고, 표본의 대표성과 관련한 선발요인, 상실요인 및 회귀요인이 있습니다. 관찰 및 측정방법과 관련해서는 검사요인과 측정수단이 문제가 됩니다.

 

외적 타당성은 조사의 분석결과를 일반화시킬 수 있는 범위를 말합니다. 외적 타당성에서는 특히 다른 모집단에 대한 일반화, 일반화가 가능한 시기 및 일반화가 가능한 상황이 문제가 됩니다.


조사대상집단의 특성 변화 측면에서 본다면 조사기간이 길어지면 내적 타당성이 저해될 우려가 있는 반면, 일반화의 가능성이 높아진다는 점에서 내적 타당성과 외적 타당성은 상충관계에 있다고 하겠습니다. 반면, 표본의 대표성과 관측 및 측정방법과 관련해서는 내적 타당성을 저해하는 여러 외생변수들이 외적 타당성까지 저해한다고 하겠습니다.






 

 


Posted by dooka
,