서베이몽키에서는 간단한 소스코드 복사를 통해 외부 사이트의 동영상을 삽입할 수 있습니다.

설문조사를 위한 자극물로 동영상을 사용하기 위해 서베이몽키 설문에 동영상 소스코드를 삽입하기 전에 몇 가지 조치를 취해야 합니다.

 

유튜브를 기준으로 살펴보면 동영상을 업로드할 때 링크에 직접 접근하는 경우에만 동영상을 시청할 수 있는 미등록 옵션 미등록 옵션을 선택합니다.



동영상 소스코드를 복사하기 전에 동영상 종료 후 추천 동영상 표시되지 않도록 옵션 선택을 해제해 줍니다



다음으로 동영상이 자동노출될 수 있도록 소스코드에 ‘autoplay=자동노출횟수구문을 삽입합니다

이제 서베이몽키 설문 유형 중 텍스트를 선택한 후 비디오 삽입/수정 메뉴에서 소스코드를 붙여 넣으면 동영상 삽입이 완료됩니다.




서베이몽키에서 동영상을 삽입하여 만든 설문을 확인하고 싶으시면 아래 링크를 눌러 보십시오.


https://ko.research.net/r/7GNZF5V





Posted by dooka
,

2011문제 2 다음은 요인분석(factor analysis)에 관한 질문이다.

1) 요인분석의 목적과 방법에 대해 논하시오. (12)

요인분석은 여러 개체 중에서 유사한 속성을 지닌 대상을 몇 개의 집단으로 구분하여 전체 자료의 구조를 이해하고자 하는 탐색적 분석방법. 변수의 축소를 목적으로 하는 요인분석의 경우 알려진 요인을 검증하는 확인적 분석과 새로운 요인을 추출하는 탐색적 요인분석 방법이 있음. 탐색적 요인분석에는 다시 주성분분석과 공통요인분석이 있음.


2) 요인분석에 사용할 수 있는 변수들이 갖추어야 할 조건을 쓰시오.(9)

 

요인분석에 사용하는 변수는 모두 등간척도 이상의 연속형 변수여야 하며,

입력변수들은 서로 독립적인 정규분포를 따르고 변수별로 등분산가정을 충족해야 함.

관측치의 사례수는 최소한 변수의 3배 이상이 되어야 하고

입력변수 간에는 어느 정도 수준이상의 상관관계가 있어야 함.

 

3) 아이겐값(eigen value)과 커뮤낼러티(communality) 값이 갖고 있는 통계적 의미와 두 값의 관계에 대해서 설명하시오.(9)

 

요인분석에서 아이겐 값과 커뮤낼러티를 이해하기 위해서는 요인적재값(factor loading)을 알아야 함. 요인적재값(factor loading)이란 변수와 요인간의 상관계수를 의미함.

커뮤낼러티(공통성, communality)란 추출된 요인이 변수가 가지는 분산의 몇 %를 설명할 수 있는가를 나타낸 값으로 변수와 요인들 간의 요인적재값(factor loading)을 제곱한 값들의 합.

아이겐값(eigen value)란 추출한 한 요인이 설명하는 총변량으로 입력변수들의 요인적재값(factor loading)을 제곱한 값들의 합.

즉 요인적재값을 변수의 관점에서 공통요인으로 얼마나 설명할 수 있는가를 파악한 것이 커뮤낼러티라면 각 요인의 관점에서 얼마나 많은 변수를 설명하는가를 파악한 것이 아이겐값(eigen value). 요인분석에서는 일반적으로 아이겐 값이 1이상인 요인만을 선택함.   

 

<요인분석 핵심정리>

요인분석은 회귀분석과 함께 다변량 분석 중 출제될 가능성이 높은 분석방법입니다. 이미 출제된 바 있을 뿐만 아니라 시장조사 실무와 학계의 연구에서 빈번하게 활용하는 방법이므로 일별할 필요가 있겠습니다.

 

1. 요인분석의 개념

 

변수 상호간의 연관성을 분석하여, 변수들에게 공통적으로 작용하는 요인을 추출하여 전체 자료를 대변하게 하여 변수의 수를 줄이는 분석방법


 

2. 요인분석의 기본가정

 

요인분석에서 사용하는 변수들은 모두 연속형 변수

(등간척도나 비율척도로 측정한 양적 변수)

입력변수들은 서로 독립적인 정규분포를 따르고 변수별로 분산은 모두 동일

응답자(관측치)의 수는 입력변수 수의 3배 이상

요인분석에 사용되는 입력변수 간에는 어느 정도 수준 이상의 상관관계가 있어야 함.

- KMO(Kaiser Meyer Olkin) 0.5 이상. Bartlett test에서 p-value가 유의수준 0.1 이하

 

3. 요인분석을 위한 기본개념

요인부하값(factor loading) 변수와 요인간의 상관계수

Communality 변수의 변량 중 분석에 포함된 요인에 의해 설명되는 비율

Eigenvalue 한 요인에 의해 설명되는 총 변량

공통분산(common variance) 한 변수가 다른 변수들과 공유하는 분산

특수분산(specific variance) 특정변수와 관련이 있는 분산

오차분산(error variance) 자료수집 단계나 측정단계에서 발생하는 오차

 

4. 추출요인 수 결정기준

 

Eigenvalue - 주성분분석에서는 eigenvalue1보다 큰 요인을 유의미한 것으로 간주. 공통요인분석에서는 1보다 기준을 약간 낮추어 고려해야 함. 공통요인분석에서communality의 평균값을 기준값으로 삼기도 함.

분석가에 의한 사전 결정

분산비율 - 자연과학분야에서는 95%의 변량을 설명할 수 있을 때까지 요인을 추출. 사회과학에서는 경우에 따라서는 총변량의 60%만 설명하더라도 만족한 해로간주.

Scree test - 특수분산의 비중이 공통분산의 비중보다 높아지는 시점에서 요인추출을 중단. eigenvalue와 요인의 수를 양축으로 그려진 그래프에서 팔꿈치 모양이 되는 곳에서 요인의 수를 결정함.  


5. 요인분석의 활용


6. 요인분석과 군집분석의 비교


군집분석은 여러 개체 중에서 유사한 속성을 지닌 대상을 몇 개의 집단으로 구분하여 전체 자료를 이해하고자 하는 탐색적 분석방법.

 



Posted by dooka
,

2011문제 2추정된 회귀모형에서 독립변수와 종속변수의 관계를 설명하고 R제곱의 의미와 표준화회귀계수 beta에 내포한 의미에 대하여 설명하시오.(10)

회귀분석은 독립변수와 종속변수들간의 함수적 관련성을 규명하기 위해 수학적 모형을 가정하고 이 모형을 측정한 변수들의 자료로부터 추정하는 분석방법으로 독립변수와 종속변수들간의 선형적 관계를 규명하여 자료의 구조를 파악하는 것이 그 목적임.

R제곱은 결정계수라고도 하며 독립변수의 종속변수에 대한 설명력의 크기를 나타내는 척도임. 다중회귀분석에서 독립변수의 수가 증가하게 됨에 따라 결정계수R 제곱의 값은 높아지게 됨. 이러한 문제점을 해결하기 위해 각각의 제곱합에 자유도를 나누어 사용하는 수정결정계수를 활용하기도 함

비표준화회귀계수를 독립변수의 종속변수에 대한 영향력의 지표로 사용하는 경우 독립변수의 측정척도에 따라 불안전성을 보이며 특히 다중회귀모형에 심각한 문제를 야기함. 이를 해소하기 위해 독립변수와 종속변수 모두 표준화하여 회귀계수를 구하게 되면 이를 표준화회귀계수 beta라고 하게 됨.

 

2015문제 2 S 레스토랑은 지난 2년간 일별 매출액 자료 등을 이용하여 다음의 회귀식을 추정하였다.

  yj = 70-12D1j+25D2j+35D3j+2xij

   yj : 추정된 일별 매출

    D1 : 여름이면 1, 그 외에는 0 D2 : 가을이면 1, 그 외에는 0

    D3 : 겨울이면 1, 그 외에는 0 Xij : 일별 신문 광고비(단위 : 백만원)

 

다음 각 물음에 답하시오. (30)

 

(1) 위 추정 회귀식에 의거하여 조사목적을 추론하고, 회귀식을 해석하시오. (10)

일별신문광고비와 일별매출과의 선형적 관계를 규명하는 것이 목적임. 이때 매출은 계절적 주기를 가지고 있어 이를 모형에 반영하기 위해 가변수를 활용하였음. 가변수를 이용해 계절적 변동요인을 반영하지 않으면 광고비의 영향이 과대추정되는 문제가 발생할 것임.

 

(2) 회귀식의 추정에 사용된 독립변수와 종속변수를 제시하고, 각 변수의 척도 형태를 제시하시오. (10)

 회귀모형의 독립변수에 질적변수의 반영이 불가피한 경우 가변수를 활용하게 됨. 문제에서 독립변수는 광고비와 계절구분이며, 종속변수는 매출. 광고비와 매출은 연속형 변수인 반면, 계절구분변수는 범주형임.

 

(3) 위에서 추정된 회귀식을 기준으로 다음 물음에 각각 답하시오. (10)

  . 위 매장의 겨울 매출액은 봄과 얼마나 차이가 나는가?

  겨울 매출 봄 매출 = 70+35+2x -70-2x=35

   . 위 매장의 가을 매출액은 여름과 얼마나 차이가 나는가?

 가을 매출 여름 매출 = 70+25+2x -70+12-2x=37



2014문제 1 다음은 SPSS를 활용한 마케팅 분석기법으로 다중회귀분석의 출력결과이다. 다음의 질문에 답하시오.


1) 이 자료의 조사목적은 무엇이며, 독립변수와 종속변수는 각각 무엇인지 설명하시오.(7)

  서비스 수준과 품질 수준이 매출에 미치는 영향을 파악하기 위한 회귀분석모형. 독립변수는 서비스 수준과 품질 수준. 종속변수는 매출임.

 

(2) 이 자료 중 각 변수의 회귀계수의 유의확률은 어떠한지 설명하고, 이러한 유의확률이

어떤 통계적 의미를 갖는지 설명하시오. (허용유의수준 : 0.05) (4)

 품질수준점수의 유의확률은 0.000. 서비스수준점수의 유의확률은 0.005. 유의확률은 검정통계량의 관측값에 대하여 귀무가설을 기각할 수 있는 최소의 유의수준. 문제에서 각 변수의 회귀계수의 유의확률이 모두 허용유의수준보다 작은 값을 가지므로 두 독립변수 모두 매출 수준에 유의미한 영향을 미치고 있는 것으로 판단할 수 있음.

 

3) 독립변수 중 어느 변수가 더 높은 영향력을 가지며, 이러한 판단근거는 무엇인지 설명하시오. (5)

 

회귀계수를 비교해 보면, 품질수준의 영향력이 월등히 높은 것으로 해석할 수 있음. 단위의 영향을 고려하여 표준화회귀계수를 검토한 경우에도 품질수준의 영향력이 더 높은 것으로 나타남. 

 

(4) 회귀방정식을 도출하시오.(9)

매출액= 0.535 + 0.976 x 품질수준 + 0.251 x 서비스수준

 

(5) 만약 내년에 이 점포의 품질수준이 4, 서비스 수준이 5점이 될 경우 점포  예상매출액(금액단위 :억원)은 얼마인지 산출하시오.(5)

매출액= 0.535 + 0.976 x 4+ 0.251 x 5 = 5.694억원



2013문제 4 다중회귀분석에서 다중공선성의 개념을 설명하고, 통계적으로 다중공선성을 진단하는 2가지 방법에 대해 설명하시오. (10)

다중공선성은 3개 이상의 독립변수들간의 강한 선형관계를 보이는 현상으로 회귀계수의 계산을 불가능하게 만들거나 계산이 가능하더라도 회귀계수의 표준오차를 크게 부풀려 정확한 검정을 할 수 없게 함. 흔히 다음과 같은 경우 다중공선성이 있는 것으로 진단하게 됨.

독립변수간의 상관관계가 독립변수와 종속변수간의 상관관계보다 높은 경우.

회귀계수의 표준오차 값이 매우 큰 경우.

독립변수가 추가되거나 삭제되었을 때 회귀계수의 변화가 큰 경우.

일부 사례의 포함이나 배제와 같은 자료의 미미한 변화에도 회귀계수에 큰 변화를 보이는 경우 

회귀계수의 부호가 이론적으로 예측한 것과 반대로 나타나는 경우.

표준화회귀계수가 이론적으로 불가능한 값인 1.0보다 크거나 -1.0보다 작게 나타나는 경우

그 외 잔여분산과 고유근 분석을 통해 다중공선성 여부를 탐색함.

 

 

<회귀분석 핵심정리>

 

회귀분석 기출 문제중에 다중공선성이 출제된 바 있습니다. 다중공선성을 포함하여 회귀분석의 기본가정에 흠결이 있을 경우 발생가능한 문제는 아래와 같이 정리할 수 있습니다.


Posted by dooka
,