'주성분분석'에 해당되는 글 1건

  1. 2016.11.22 2016년 31회 경영지도사 2차 시험 시장조사론 기출문제 해설 3 of 3

【 문제 5 】 제품만족도와 기업신뢰도라는 구성개념(construct)을 측정하기 위하여 각 구성개념별로 복수의 설문문항을 사용하였다. 제품만족도와 기업신뢰도를 독립변수로 하고 기업 수익성을 종속변수로 하는 회귀모형을 분석하고자 할 때, 두 독립변수의 측정항목을 대상으로 요인분석을 실행하여 독립변수 값으로 투입하기 위한 방법을 설명하시오.(10점)


☞ 문제 解說 5번 문제는 요인분석을 이용한 측정의 타당성 점검을 묻는 것인지, 회귀분석에서의 다중공선성에 대한 대처수단으로서의 요인분석을 묻는 것인지는 분명하지 않으나 구성개념을 측정하기 위해 설문문항을 구성했다는 지시문으로 볼 때 측정의 타당성 점검과 관련한 문제로 보입니다. 그러나, 정확하게 어떤 내용을 언급해야 할지 명확하지는 않습니다. 문제 5번과 같이 논점이 다소 분명하지 않은 경우에는 본인이 생각하는 답변 외에도 관련 내용을 간략하게나마 언급하는 것이 안전할 것입니다.


제품만족도와 기업신뢰도라는 추상적 개념을 측정도구 즉 설문이 얼마나 잘 반영하는지를 파악하기 위해 요인분석을 적용하게 됩니다. 요인분석은 변수들 간의 상관관계가 높은 것끼리 묶어 공통요인을 추출하는 다변량분석기법으로 입력변수들의 총분산을 이용해 공통요인을 추출하는 주성분분석과 입력변수들이 가지는 공통분산만을 이용해 공통요인을 추출하는 공통요인분석이 있습니다. 정보의 손실을 방지하기 위해 주성분을 적용하는 것이 일반적입니다.


요인분석 실시결과 항목의 요인적재량(factor loading)이 0.6이상이면 분석대상 변수가 해당요인에 속하는 것으로 판단하게 됩니다. 요인적재량이란 각 변수와 요인간의 상관계수로 해당 변수를 그 요인이 얼마나 잘 설명해주는가를 나타냅니다. 요인분석 결과 원래 의도한 구성개념대로 항목들이 하나의 요인으로 묶이고, 다른 개념으로 분류한 항목들이 다른 요인으로 묶이는지 파악함으로써 측정의 타당성을 점검할 수 있습니다.


제품만족도와 기업신뢰도를 구성하는 세부항목을 이루는 변수들을 회귀분석을 위한 독립변수로 활용할 경우, 독립변수들간의 강한 선형관계로 인해 회귀계수의 계산이 불가능하거나 회귀계수의 표준오차를 과장하여 검정 자체가 불가능하게 만드는 다중공선성의 문제가 발생하게 됩니다.


다중공선성의 문제를 보정하기 위한 방법으로 서로 공행하는 독립변수들을 하나의 주성분으로 통합하여 이들 주성분에 종속변수를 회귀시키는 방법이 있습니다. 주성분분석은 n개의 입력변수를 가지는 총분산을 n개의 주성분으로 다시 나타내고 총분산에 대한 설명력이 높은 순서대로 주성분요인을 추출하는 방법입니다. 주성분분석에서 원래의 변수들과 요인간의 관계를 분명히 하게 하기 위해 요인축을 회전하게 되는데 요인의 축들이 직각이 되도록 회전하게 되면 요인 간의 상관관계가 거의 없어지므로 다중공선성을 보정할 수 있습니다. 기존 독립변수 대신 주성분을 독립변수로 한 회귀분석을 실시하게 되면 주성분들 간의 독립성이 보장되므로 다중공선성의 문제를 보정할 수 있습니다.


그러나, 회귀분석에 적용한 주성분들은 원래 독립변수들의 선형결합 형태를 취하고 있기 때문에 직관적인 해석이 매우 어렵다는 취약점이 있습니다. 또한 독립변수의 총분산에 대한 설명력이 가장 높은 주성분이라고 하더라도 이것이 반드시 종속변수와 가장 높은 상관관계를 지는 것이 아니라는 한계가 있습니다.  


【 문제 6 】 층화표본추출법의 개념과 그 추출방법 2가지에 관하여 설명하시오. (10점)


추출확률이 정해져 있고 사전적으로 알 수 있어 표본추출로 인해 발생하는 오차에 대한 추정이 가능한 확률표본추출방법에는 가장 기본적인 단순임의추출 외에 층화표본추출, 체계적 추출 및 집락추출의 방법이 있습니다.


층화표본추출법은 모집단을 이질적인 몇 개의 층(stratum)으로 구분하여 각 층별로 단순임의추출을 적용하는 방법입니다. 층화표본추출법은 각 층별로 충분한 표본크기 확보가 가능하고 층간 이질성이 클 경우 조사의 정확성을 증대시킬 수 있습니다.


층화표본추출법에는 각 층의 크기만을 고려하는 비례배분과 분산까지 고려하는 최적배분의 방법이 있습니다. 비례배분은 층당 조사비용과 분산이 동일할 경우 적용하는 방법으로 각 층이 모집단에서 차지하는 비율만큼 표본을 할당하는 방법입니다.




최적배분은 허용오차한계를 제약조건으로 조사비용을 극소화하는 표본할당방법을 찾은 것입니다. 최적배분은 다시 네이만 배분(Neyman allocation)와 데밍 배분(Deming allocation)으로 구분할 수 있습니다.


네이만 배분(Neyman allocation)은 표본크기가 일정하게 주어져 있고 층마다 조사단위별 비용이 일정할 때 적용하는 방법으로 표본에 대한 할당은 각 층이 모집단에서 차지하는 비중 외에도 각 층별 분산에 비례하여 표본을 할당합니다.

 



데밍 배분(Deming allocation)은 총비용이 일정하게 주어져 있고 조사단위당 비용이 층에 따라 크게 변동할 때 적용하는 방법으로 각 층이 모집단에서 차지하는 비중이 클수록, 각 층의 분산이 클수록 표본을 보다 더 많이 할당하고 각 층의 조사단위당 비용이 높을수록 표본을 더 적게 할당하게 됩니다.




층화표본추출은 집단 간에 이질성이 존재할 경우 단순임의추출보다 더 정확하게 모집단을 대표하는 표본을 추출할 수 있습니다. 그러나, 집단을 구분하는 변수가 잘못된 경우 오히려 대표성을 저해할 수 있습니다.

Posted by dooka
,