광고전략은 흔히 아래 다섯 가지 질문에 답변하는 것에서 출발합니다.  

광고의 목표는?

광고의 목표집단(target audience)?

어떤 편익을 소비자에게 약속(promise)할 것이며 그 약속의 근거(support)를 어떻게 제시할 것인가?

어떻게 브랜드를 차별화할 것인가?

어떤 매체를 통해 광고 메시지를 전달할 것인가?


목표집단에 대한 약속과 근거(promise & support)로 구성된 광고 크리에이티브는 그 형식에 관계없이 기본적으로 아래와 같은 구조를 가지게 됩니다.

내가(개인으로서의 목표집단) 광고가 지향하는 어떤 행동 하면 나는 미래의 주관적 경험으로서의 어떤 소비자 편익)을 얻을 것이다. 왜냐하면….’

광고 내용에 대한 평가 역시 위의 구조가 얼마나 잘 작동하는가가 주를 이룰 것입니다. 그런데 위의 광고 크리에이티브 구조가 잘 작동하기 위해서는 광고 크리에이티브가 관련성(Relevance), 독특성(Originality), 영향력(Impact)를 가지고 있어야 합니다. 그러므로, 다양한 광고 내용 평가항목이 있겠지만 Relevance, Originality, Impact(R.O.I)에 대한 평가를 공통적으로 고려하게 됩니다.

R.O.I를 질문하는 대표적인 문항을 정리해 보면 다음과 같습니다.

단일집약적인(single-minded) 광고 메시지는 제품(브랜드)과 관련성(relevance)이 있어야 하고 목표집단과의 관련성(relevance)을 가지고 있어야 합니다. 특히, 목표집단과의 관련성이 제품(브랜드)과의 관련성보다 더 중요합니다. 소비자 편익과 관련 없는 제품 특성을 전달하는 광고는 실패할 가능성이 큽니다. ‘세게 1위 브랜드와 같은 기업 중심의 메시지는 소비자들에게 그와 같은 사실이 어떤 의미가 있는지 생각해볼 필요가 있습니다. 물론, ‘Avis is only No. 2 in rent cars So we try harder.’와 같이 제품(브랜드)의 특성이 소비자 편익의 근거간 된다면 이야기는 달라질 것입니다.

그런데 유사제품 군 내에서 유사한 목표시장에서 경쟁하는 player들은 근본적으로 유사한 소비자 편익의 약속과 근거들을 가지고 있을 것이므로 광고 크리에이티브 뿐만 아니라 광고전략 역시 독창성(originality)을 가질 필요가 있습니다. 경쟁 player와 동일한 소비자 편익을 제안하고 있는 것은 아니지, 약속하는 편익의 근거가 본질적으로 동일한 것은 아닌지 점검해보아야 합니다.

광고의 영향력(impact)이란 목표집단에게 광고가 전달하고자 메시지에 관심을 집중시킬 수 있는 광고의 역량을 의미합니다. 광고의 영향력(impact)는 매체와 광고 크리에이티브 측면에서 파악할 수 있습니다. 의외성이 있으면서도 목표집단이 광고 메시지 수용에 관대할 수 있는 시공간을 중심으로 매체전략을 구성할 때 광고의 영향력(impact)은 높아집니다. 또한, 광고가 목표집단의 니즈에 적합하면서도 경쟁자와는 차별화된 약속(promise)을 제시하고 그 근거(support)가 약속에 대한 믿음을 심어주는 경우 광고의 영향력(impact)은 높아집니다. 약속(promise)에 대한 근거(support)는 제품의 특성뿐만 아니라 소비자 실생활과의 관련성, 광고의 카피, 광고의 음악, 모델 및 광고의 분위기 등 일체의 요소들을 포함합니다.

광고의 영향력(impact)는 특히 광고 제품이 저관여(low involvement) 제품일 때 중요합니다. 껌과 같은 기호식품과 냉장고 등 내구성 소비자 구매 시 소비자들의 관여도는 다를 수 밖에 없고 이에 따라 정보탐색행위의 수준 역시 달라질 것이기 때문입니다. 물론 제품에 대한 관여도는 절대적으로 정해진 것은 아니며, 소비자의 상황에 따라 달라질 수 있습니다.

흔히 광고효과측정 시 관성적으로 광고에 대한 호감도를 측정하고 그 점수에만 집착하기 쉽습니다. 그러나, 이런 기계적인 접근보다는 광고 전략의 큰 틀에서 광고가 광고의 목표를 제대로 구현하고 있는지를 파악하는 것이 보다 더 중요합니다.



 


 


Posted by dooka
,

2016/08/08 - [야행하는 리서치] - 8. 실험설계의 종류①

2016/08/13 - [야행하는 리서치] - 9.실험설계의 종류②_진실험설계

준실험설계는 무작위배정에 의한 실험집단과 통제집단의 동질성을 확보할 수 없는 실험설계입니다. 준실험설계에는 다시 어느 정도 인과관계를 추론해볼 수 있는 준실험설계와 인과관계 추론이 어려운 준실험설계로 나누어 볼 수 있습니다.

인과관계를 추론해볼 수 있는 준실험설계에는 비동질적 통제집단설계, 회귀-불연속 설계, 단절적 시계열설계, 통제-시계열설계 등의 방법이 있습니다. 이 중 비동질적 통제집단설계를 제외하면 시장조사보다는 공공정책평가에 좀 더 유용한 설계라고 판단되므로 비동질적 통제집단설계를 살펴보겠습니다.

비동질적 통제집단설계는 조사대상 집단을 두 개로 나누어 한 집단에는 실험처리를 하고 한 집단에는 실험처리를 하지 않고 사전·사후측정을 하는 실험설계입니다. 비동질적 통제집단설계는 통제집단 사전사후측정 설계와 유사하지만 무작위배정을 통한 실험집단과 통제집단의 평균적인 동질성 확보가 이루어지지 않는 점에서 차이가 있습니다. 다만 비동질적 통제집단설계는 짝지우기(matching) 등의 방법을 통해 통제집단을 최대한 실험집단과 유사하게 구성하려는 실험설계입니다.

인과적 추론의 요건을 충족하지 못했다는 점에서 인과관계 추론이 어려운 준실험설계를 전실험설계(pre-experimental design)라고 부르기도 합니다. 전실험설계에는 단일집단사후측정설계, 비동질적집단 사후측정설계, 단일집단 사전사후측정설계 등이 있습니다. 이 중에서 실무에서 빈번하게 적용하는 단일집단사후측정설계를 살펴보겠습니다.

단일집단사후측정설계는 일회성사례연구(one-shot case study)로써 하나의 집단에 실험처리를 하고 그 측정값을 실험결과(effect)로 보는 방법입니다. 예를 들어 광고를 본 후 광고효과를 측정하는 조사가 단일집단사후측정설계 방식에 해당합니다. 단일집단사후측정설계는 성숙요인, 역사요인, 선발요인, 상실요인 등의 내적 타당성의 저해요인을 제어할 수 없어서 인과관계 추론의 타당성을 거의 기대할 수 없습니다.

단일집단사후측정설계는 한계가 분명함에도 불구하고 비교적 비용이 저렴하고 조사기간 역시 절감할 수 있다는 점에서 실무에서는 너무나 빈번하게 활용하고 있습니다. 그러나 단일집단사후측정설계를 적용하면서도 실험결과를 평가하려는 시도는 대단히 모순적이고 이상한 시도입니다. 설문지와 조사설계를 표준화하고 결과를 DB하여 최소한의 기준을 형성하려는 노력이 필요합니다.

 

 

 

 

'야행하는 리서치' 카테고리의 다른 글

12, 측정의 타당성  (0) 2016.08.23
11. 광고내용평가  (0) 2016.08.21
9.실험설계의 종류②_진실험설계  (0) 2016.08.13
8. 실험설계의 종류①  (0) 2016.08.08
7.신제품 컨셉트 테스트 프리퀄  (0) 2016.08.06
Posted by dooka
,

2016/08/08 - [야행하는 리서치] - 8. 실험설계의 종류①

실험설계를 살펴보기 전에 실험설계를 묘사하는 기호들의 의미를 정리해 보면 아래와 같습니다.

 

진실험설계는 무작위배정을 통해 실험집단과 통제집단의 비교가 가능하고 독립변수가 조작가능하며, 경쟁가설의 통제가 가능한 실험설계를 말합니다. 진실험설계 중 현실적으로 많이 사용하는 설계의 유형에는 통제집단 사후측정 설계가 있습니다.

통제집단 사후측정 설계는 인과적 추론의 저해요인인 역사요인과 성숙요인, 그리고 회귀요인을 제거할 수 있습니다. 그러나, 실험처리 전에 실험집단과 통제집단의 관찰값이 동일한지 여부를 점검할 수 없다는 한계가 있습니다.

통제집단 사후측정 설계가 처리 전 실험집단과 통제집단의 관찰값을 알 수 없다는 점을 보완한 것이 통제집단 사전사후측정 설계 혹은 고전적 실험설계입니다.

통제집단 사전사후측정 설계은 사전측정과 사후측정을 실시하게 되므로 검사요인이 유력한 내적 타당성 저해요인으로 작용하게 됩니다. 진실험설계 중 가장 강력한 실험설계의 유형에는 솔로몬의 4집단실험설계가 있습니다. 솔로몬의 4집단실험설계는 일정 및 비용 상의 문제로 시장조사에서 본격적으로 적용하기에는 한계가 있습니다.

 

 

Posted by dooka
,

서베이몽키 GOLD 계정 이상에서는 응답자를 무작위로 배치하여 각 응답자에게 서로 다른 이미지나 텍스트를 보여 줄 수 있습니다. 서베이몽키 설문 텍스트 유형에서는 동영상 링크 삽입이 가능하므로 동영상 역시 무작위로 할당 가능합니다.

무작위할당(random asignment) 기능은 실험설계에서 중요한 의미를 가집니다. 인과관계를 확정하기 위해서는 공변화와 시간적 선행성 외에 경쟁가설의 배제가 가능해야 하는데 이 무작위할당을 적용함으로써 비교하고자 하는 두 집단은 관심 있는 처리효과 외에 다른 특성은 평균적으로 동일하다고 볼 수 있어 두 집단의 차이를 설명해주는 다른 경쟁가설을 제어할 수 있기 때문입니다. 예를 들어 광고모델이 애니메이션 캐릭터, 교육전문가, 일반인으로 구분하고 모델에 따라 광고에 대한 호감도에 차이가 있는지 알아보고자 한다면 표본의 설문응답자가 각각의 서로 다른 모델을 기용해 제작한 광고를 볼 확률이 동일해야 합니다. 그렇지 않다면 과연 광고에 대한 호감도의 차이가 모델 때문인지 판단하기 어렵게 됩니다.

서베이몽키 설문디자인 작성기에서 이미지 A/B테스트를 선택한 후 무작위 할당할 이미지를 업로드하면 이미지가 동일한 확률로 응답자가 보는 설문에 무작위로 노출하게 됩니다.

 

 

아래 서베이몽키 웹링크에서 무작위로 이미지가 노출되는 것을 확인해 보십시오.

https://ko.research.net/r/QLTPVM6

 

 

 

궁금한 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변드리겠습니다!

 

 

Posted by dooka
,

서베이몽키는 Gold계정에서 주관식 문항의 핵심 키워드를 추출해주는 텍스트분석 기능을 제공하고 있습니다.

그런데, 서베이몽키 텍스트분석은 우리글의 특성을 고려하지 않아 표본수가 증가하게 되면 질문내용과는 무관한 조사와 서술어의 출현빈도가 높아지는 한계가 있습니다. R이 제공하는 word cloud 패키지를 이용하면 이러한 한계를 여느 정도 극복하는 것이 가능합니다.

우선 R에서 word cloud를 생성하기 위해서는 wordcloud 패키지 외에 한국어 관련 작업을 원활하게 하기 위해 KoNLP 패키지를 설치해야 합니다. 설치가 정상적으로 이루어지지 않는다면 JAVA가 최신 버전인지 확인해 보시기 바랍니다.

이제 받고 싶은 선물에 대한 응답을 가지고 word cloud를 만들어 보겠습니다. 디렉토리 지정 후 KoNLP 패키지와 word cloud 패키지를 활성화합니다.

 

파일을 우선 txt라고 명명한 변수에 넣은 후 명사형 응답만을 선택하여 wish라는 변수에 다시 넣어 주었습니다. Wish 변수를 리스트업 해보면 나이키나이로 인식되는 것처럼 의도하지 않은 결과가 나오는 것을 확인할 수 있습니다.

 

이런 문제가 제거하기 위해 사전에 원하는 명사형을 등록해 줍니다 

☞ R에서 사용자가 많지 않아 삭제되면서 mergeUserDic(data.frame("명사로 등록할 단어","ncn")) 명령은 더 이상 사용할 수 없습니다.대체 명령어는 buildDictionary(ext_dic = "woorimalsam", user_dic=data.frame("명사로 등록할 단어","ncn"),replace_usr_dic = T)입니다. 그런데 문제는 이 명령어를 적용해도 단어가 등록되지 않는 오류가 발생한다는 점입니다. 아마 버그가 있는 것으로 판단되는데 해결될 때까지는 이 과정은 생략하고 wordcloud를 만들면 됩니다. 당분간 buildDictionary 명령 대신 단어를 수정하는 등의 조치를 취해 wordcloud에 나타날 수 있도록 원본 텍스트 데이터를 수정하는 수고를 하셔야 할 것같습니다.    

 

단어 등록 후 wish 변수를 다시 나열해본 결과, “나이로 구분되던 나이키가 나이키하나로 인식되는 것을 확인할 수 있습니다.   

 

무의미한 단어를 제거하기 위해 두 개 이상인 단어만 선택했습니다.

 

다음으로 그 외 의미 없는 단어들을 변수에서 제거해 주었습니다.

 

불필요한 단어를 제거한 후에는 word cloud를 생성합니다.

 

word cloud를 생성한 결과는 아래와 같습니다.

R을 이용해 word cloud를 생성해 본 결과 확실히 우리글에 적합한 결과를 도출할 수 있음을 알 수 있습니다. 그러나, 필요한 단어를 등록하고 불필요한 단어를 제거하는 등, 주관식 문항을 코딩 하는 정도의 수고까지는 아니더라도 데이터를 정제하는 과정은 반드시 필요합니다. 만약 데이터의 표본수, 사례수가 많아진다면 의외로 손이 많이 갈 수도 있을 것 같습니다. 코딩요원을 투입해 주관식 문항을 처리하는 기존 방법을 대체하기 보다는 보완적인 방법으로 R word cloud를 사용할 수 있을 것으로 보입니다 

 

'R기어가기' 카테고리의 다른 글

6. R로 차트 만들기 ①  (2) 2017.08.05
5. 테이블!! R로 다시 만들기  (0) 2017.07.13
4. R을 이용한 IPA 산점도 작성  (0) 2017.01.13
3. 테이블! R로 만들기  (0) 2017.01.07
1.R! 파일을 열다  (0) 2016.07.02
Posted by dooka
,

인과적 추론의 조건을 시간적 선행성, 공변화 및 경쟁가설의 배제라고 한다면 인과관계를 규명하기 위해서는 통계적 실험-설문조사 역시 인과적 추론의 조건에 맞게 계획해야 합니다.

 

 

그런데, 모든 실험이 인과적 추론의 조건을 충족한다는 것은 현실적으로 어렵고, 실험설계는 인과적 추론의 조건 충족 정도에 따라 진실험 설계, 준실험 설계, 비실험설계로 분류하게 됩니다.

시장조사에 빈번하게 이루어지는 횡단면 조사는 실험집단과 통제집단의 동질성을 확보하는데 한계가 있는 준실험설계에 근거해 이루어지는 경우가 일반적입니다. 검정의 대상이 되는 실험처리를 한 집단을 실험집단(experiment group)이라고 하고 실험처리를 하지 않고 실험집단과 비교하는 집단을 통제집단(control group)이라고 합니다.

진실험설계는 현실의 시장조사에 적용하기에는 무리가 따르지만 진실험설계에 대한 이해는 무척 중요합니다. 왜냐하면 실무에서 적용하는 다양한 실험설계의 준거가 되기 때문입니다. 마치 경제학에서 완전경쟁시장이 현실에 존재하지는 않지만 다양한 불완전경쟁시장에서의 자원배분의 성과를 판단하는데 기준이 되는 것과 유사하다고 생각하면 될 것 같습니다.

 

Posted by dooka
,

신제품개발은 기업의 지속적인 성장과 수입확보를 위해 필수적인 활동입니다. 그러나, 미국의 경우 평균 35~40%의 신제품이 실패하고, FMCG군은 거의 90%의 신제품이 실패하는 것으로 나타났습니다. 신제품개발의 주요 실패 원인은 기존제품과 차별화된 소비자 편익을 제안하지 못하기 때문입니다. 차별화된 소비자 편익의 제안은 통찰력 있는 소비자 이해에 기반을 두고 있는데, 소비자 이해의 중요한 수단이 되는 설문 조사가 소비자에 대한 정확한 이해를 제공하지 못하는 경우도 있습니다. 


뇌 과학의 설명에 의하면 인간의 뇌는 인간, 포유류, 그리고 파충류의 영역으로 구분된다고 합니다. 그런데 대부분의 소비재 구매의사결정은 포유류의 영역에서 감성적으로 이루어지는 반면, 언어로 된 설문 조사에 대한 응답은 인간의 뇌 영역에서 처리되므로 설문 조사만으로는  소비자의 구매의사결정을 예측하는 데 한계가 있을 수 밖에 없습니다. 구태여 뇌 과학의 설명이 아니더라도 설문지에 기반을 둔 정량조사는 응답자의 기억과 언어에 의존하기 때문에, 소비자 자신도 구체적으로 인식하지 못하는 잠재욕구를 발굴하는 데에는 어려움이 있습니다. 또한 제한된 시간에 제한된 인원을 대상으로 실시하는 소비자좌담회(Focus Group Interview) 역시 기존 제품이나 광고에 대한 반응을 점검하는 데에는 효과적이지만 소비자의 심층적인 감성과 잠재욕구를 잡아내는 데는 큰 힘을 발휘하지 못하기도 합니다.


기존 설문 조사의 한계를 극복하기 위해 관찰기법, ZMET, 뇌 영상 촬영법 등 새로운 조사기법들을 소비자 조사에 적용하고 있으며 실제로 기존 설문 조사로는 기대하기 어려운 성과를 내고 있습니다.  그런데 위와 같은 방법은 비용이 많이 들고 최종 조사결과를 도출하기까지 오랜 시간이 걸린다는 문제가 있습니다. 이러한 한계 때문인지 우리나라의 경우에 대기업들만 적극적으로 위 방법을 활용하고 있는 실정입니다.


비용과 시간 상의 제약 때문에 새로운 조사기법을 적용하기 어려운 상황에 처해있다면, 기존 설문 조사를 관성적으로 답습할 것이 아니라 기존 설문 조사의 한계를 극복하기 위해 노력을 기울일 필요가 있습니다.

우선 기존 2차 자료를 활용해서 시장과 소비자에 대한 개략적인 이해를 확보해야 합니다. 특히 2차 자료를 찾을 때 잊지 말아야 할 점은 자료를 통해서 얻고자 하는 정보가 무엇인지 명확히 하는 것입니다. 다음 단계의 조사나 의사결정에 필요 없는 2차 자료를 모으는 것은 조사가 아니라는 점을 명심해야 합니다.


만약 담당하고 있는 제품이나 프로젝트에 길이 보이지 않을 때는 현장으로 나가 소비자를 관찰해 보시길 권합니다. 정기적으로 소비자를 관찰하는 기회를 가지면 더욱 좋을 것입니다. 물론 관찰조사는 매우 전문적인 역량이 필요합니다. 그러나, 체계적인 조사설계를 바탕으로 성실하게 관찰하는 것을 반복한다면 뜻 밖의 소비자 통찰력을 얻으실 수 있습니다.


신제품 컨셉트 테스트를 위한 설문의 구성 역시 고민이 필요한 항목입니다. 우선 설문의 초반부에는 제품과 관련한 소비자 문제를 파악하는데 할애해야 합니다. 예를 들어 시내 버스의 움직임과 연동하는 VR 레이싱 게임을 기획하고 있다면 우선 휴대용 게임기 시장에서의 소비자 문제를 점검하는 것에서 설문을 시작하게 될 것입니다. 신제품 컨셉트 테스트를 위한 설문의 초반부에서는 응답자가 질문의 의도를 파악하지 않으면서도 신제품이 해결하려는 소비자 문제를 노출할 수 있도록 설문을 간접적으로 구성하는 것이 중요합니다. 또한, 2차 자료와 선행조사 및 소비자 관찰을 통해 소비자에 대한 높은 이해를 가지고 있어야 할 뿐만 아니라 소비자 언어로 설문을 작성하려고 노력해야 합니다.


신제품 컨셉트 테스트에 활용할 자극물 역시 가급적 실제 제품에 가장 근접한 시제품이나 영상으로 제공하는 것이 좋고 현재의 제품 개발단계에서 그것이 어렵다면 컨셉트 설명문 작성에 많은 주의를 기울여야 합니다. 신제품 컨셉트 테스트를 위한 설문의 후반부에서는 주어진 신제품 컨셉트의 특성이 당면한 소비자 문제 해결에 도움을 주고 있는지 즉, 소비자 편익이 무엇인지 파악해야 하고 더불어 직접적으로 신제품 컨셉트에 대한 수용도를 선호도, 구매의향, 추천의향 등 다양한 시각에서 점검합니다.


또한, 단발성의 신제품 컨셉트 테스트를 지양하고 설문지를 표준화하여 개별 설문 조사 결과의 비교가능성을 높이고, 설문 조사의 결과를 데이터베이스화하여 설문 조사 결과의 해석 및 의사결정의 기준을 지속적으로 정립해 나가야 합니다. 


신제품 컨셉트 테스트 개선을 위한 조직 차원의 지원과 노력을 기대하기 어려운 상황이라고 하더라도 개인적 노력을 지속한다면 개인의 능력개발과 경력관리에 큰 도움이 됩니다.

 


Posted by dooka
,

서베이몽키에서는 간단한 소스코드 복사를 통해 외부 사이트의 동영상을 삽입할 수 있습니다.

설문조사를 위한 자극물로 동영상을 사용하기 위해 서베이몽키 설문에 동영상 소스코드를 삽입하기 전에 몇 가지 조치를 취해야 합니다.

 

유튜브를 기준으로 살펴보면 동영상을 업로드할 때 링크에 직접 접근하는 경우에만 동영상을 시청할 수 있는 미등록 옵션 미등록 옵션을 선택합니다.



동영상 소스코드를 복사하기 전에 동영상 종료 후 추천 동영상 표시되지 않도록 옵션 선택을 해제해 줍니다



다음으로 동영상이 자동노출될 수 있도록 소스코드에 ‘autoplay=자동노출횟수구문을 삽입합니다

이제 서베이몽키 설문 유형 중 텍스트를 선택한 후 비디오 삽입/수정 메뉴에서 소스코드를 붙여 넣으면 동영상 삽입이 완료됩니다.




서베이몽키에서 동영상을 삽입하여 만든 설문을 확인하고 싶으시면 아래 링크를 눌러 보십시오.


https://ko.research.net/r/7GNZF5V





Posted by dooka
,

2011문제 2 다음은 요인분석(factor analysis)에 관한 질문이다.

1) 요인분석의 목적과 방법에 대해 논하시오. (12)

요인분석은 여러 개체 중에서 유사한 속성을 지닌 대상을 몇 개의 집단으로 구분하여 전체 자료의 구조를 이해하고자 하는 탐색적 분석방법. 변수의 축소를 목적으로 하는 요인분석의 경우 알려진 요인을 검증하는 확인적 분석과 새로운 요인을 추출하는 탐색적 요인분석 방법이 있음. 탐색적 요인분석에는 다시 주성분분석과 공통요인분석이 있음.


2) 요인분석에 사용할 수 있는 변수들이 갖추어야 할 조건을 쓰시오.(9)

 

요인분석에 사용하는 변수는 모두 등간척도 이상의 연속형 변수여야 하며,

입력변수들은 서로 독립적인 정규분포를 따르고 변수별로 등분산가정을 충족해야 함.

관측치의 사례수는 최소한 변수의 3배 이상이 되어야 하고

입력변수 간에는 어느 정도 수준이상의 상관관계가 있어야 함.

 

3) 아이겐값(eigen value)과 커뮤낼러티(communality) 값이 갖고 있는 통계적 의미와 두 값의 관계에 대해서 설명하시오.(9)

 

요인분석에서 아이겐 값과 커뮤낼러티를 이해하기 위해서는 요인적재값(factor loading)을 알아야 함. 요인적재값(factor loading)이란 변수와 요인간의 상관계수를 의미함.

커뮤낼러티(공통성, communality)란 추출된 요인이 변수가 가지는 분산의 몇 %를 설명할 수 있는가를 나타낸 값으로 변수와 요인들 간의 요인적재값(factor loading)을 제곱한 값들의 합.

아이겐값(eigen value)란 추출한 한 요인이 설명하는 총변량으로 입력변수들의 요인적재값(factor loading)을 제곱한 값들의 합.

즉 요인적재값을 변수의 관점에서 공통요인으로 얼마나 설명할 수 있는가를 파악한 것이 커뮤낼러티라면 각 요인의 관점에서 얼마나 많은 변수를 설명하는가를 파악한 것이 아이겐값(eigen value). 요인분석에서는 일반적으로 아이겐 값이 1이상인 요인만을 선택함.   

 

<요인분석 핵심정리>

요인분석은 회귀분석과 함께 다변량 분석 중 출제될 가능성이 높은 분석방법입니다. 이미 출제된 바 있을 뿐만 아니라 시장조사 실무와 학계의 연구에서 빈번하게 활용하는 방법이므로 일별할 필요가 있겠습니다.

 

1. 요인분석의 개념

 

변수 상호간의 연관성을 분석하여, 변수들에게 공통적으로 작용하는 요인을 추출하여 전체 자료를 대변하게 하여 변수의 수를 줄이는 분석방법


 

2. 요인분석의 기본가정

 

요인분석에서 사용하는 변수들은 모두 연속형 변수

(등간척도나 비율척도로 측정한 양적 변수)

입력변수들은 서로 독립적인 정규분포를 따르고 변수별로 분산은 모두 동일

응답자(관측치)의 수는 입력변수 수의 3배 이상

요인분석에 사용되는 입력변수 간에는 어느 정도 수준 이상의 상관관계가 있어야 함.

- KMO(Kaiser Meyer Olkin) 0.5 이상. Bartlett test에서 p-value가 유의수준 0.1 이하

 

3. 요인분석을 위한 기본개념

요인부하값(factor loading) 변수와 요인간의 상관계수

Communality 변수의 변량 중 분석에 포함된 요인에 의해 설명되는 비율

Eigenvalue 한 요인에 의해 설명되는 총 변량

공통분산(common variance) 한 변수가 다른 변수들과 공유하는 분산

특수분산(specific variance) 특정변수와 관련이 있는 분산

오차분산(error variance) 자료수집 단계나 측정단계에서 발생하는 오차

 

4. 추출요인 수 결정기준

 

Eigenvalue - 주성분분석에서는 eigenvalue1보다 큰 요인을 유의미한 것으로 간주. 공통요인분석에서는 1보다 기준을 약간 낮추어 고려해야 함. 공통요인분석에서communality의 평균값을 기준값으로 삼기도 함.

분석가에 의한 사전 결정

분산비율 - 자연과학분야에서는 95%의 변량을 설명할 수 있을 때까지 요인을 추출. 사회과학에서는 경우에 따라서는 총변량의 60%만 설명하더라도 만족한 해로간주.

Scree test - 특수분산의 비중이 공통분산의 비중보다 높아지는 시점에서 요인추출을 중단. eigenvalue와 요인의 수를 양축으로 그려진 그래프에서 팔꿈치 모양이 되는 곳에서 요인의 수를 결정함.  


5. 요인분석의 활용


6. 요인분석과 군집분석의 비교


군집분석은 여러 개체 중에서 유사한 속성을 지닌 대상을 몇 개의 집단으로 구분하여 전체 자료를 이해하고자 하는 탐색적 분석방법.

 



Posted by dooka
,

2011문제 2추정된 회귀모형에서 독립변수와 종속변수의 관계를 설명하고 R제곱의 의미와 표준화회귀계수 beta에 내포한 의미에 대하여 설명하시오.(10)

회귀분석은 독립변수와 종속변수들간의 함수적 관련성을 규명하기 위해 수학적 모형을 가정하고 이 모형을 측정한 변수들의 자료로부터 추정하는 분석방법으로 독립변수와 종속변수들간의 선형적 관계를 규명하여 자료의 구조를 파악하는 것이 그 목적임.

R제곱은 결정계수라고도 하며 독립변수의 종속변수에 대한 설명력의 크기를 나타내는 척도임. 다중회귀분석에서 독립변수의 수가 증가하게 됨에 따라 결정계수R 제곱의 값은 높아지게 됨. 이러한 문제점을 해결하기 위해 각각의 제곱합에 자유도를 나누어 사용하는 수정결정계수를 활용하기도 함

비표준화회귀계수를 독립변수의 종속변수에 대한 영향력의 지표로 사용하는 경우 독립변수의 측정척도에 따라 불안전성을 보이며 특히 다중회귀모형에 심각한 문제를 야기함. 이를 해소하기 위해 독립변수와 종속변수 모두 표준화하여 회귀계수를 구하게 되면 이를 표준화회귀계수 beta라고 하게 됨.

 

2015문제 2 S 레스토랑은 지난 2년간 일별 매출액 자료 등을 이용하여 다음의 회귀식을 추정하였다.

  yj = 70-12D1j+25D2j+35D3j+2xij

   yj : 추정된 일별 매출

    D1 : 여름이면 1, 그 외에는 0 D2 : 가을이면 1, 그 외에는 0

    D3 : 겨울이면 1, 그 외에는 0 Xij : 일별 신문 광고비(단위 : 백만원)

 

다음 각 물음에 답하시오. (30)

 

(1) 위 추정 회귀식에 의거하여 조사목적을 추론하고, 회귀식을 해석하시오. (10)

일별신문광고비와 일별매출과의 선형적 관계를 규명하는 것이 목적임. 이때 매출은 계절적 주기를 가지고 있어 이를 모형에 반영하기 위해 가변수를 활용하였음. 가변수를 이용해 계절적 변동요인을 반영하지 않으면 광고비의 영향이 과대추정되는 문제가 발생할 것임.

 

(2) 회귀식의 추정에 사용된 독립변수와 종속변수를 제시하고, 각 변수의 척도 형태를 제시하시오. (10)

 회귀모형의 독립변수에 질적변수의 반영이 불가피한 경우 가변수를 활용하게 됨. 문제에서 독립변수는 광고비와 계절구분이며, 종속변수는 매출. 광고비와 매출은 연속형 변수인 반면, 계절구분변수는 범주형임.

 

(3) 위에서 추정된 회귀식을 기준으로 다음 물음에 각각 답하시오. (10)

  . 위 매장의 겨울 매출액은 봄과 얼마나 차이가 나는가?

  겨울 매출 봄 매출 = 70+35+2x -70-2x=35

   . 위 매장의 가을 매출액은 여름과 얼마나 차이가 나는가?

 가을 매출 여름 매출 = 70+25+2x -70+12-2x=37



2014문제 1 다음은 SPSS를 활용한 마케팅 분석기법으로 다중회귀분석의 출력결과이다. 다음의 질문에 답하시오.


1) 이 자료의 조사목적은 무엇이며, 독립변수와 종속변수는 각각 무엇인지 설명하시오.(7)

  서비스 수준과 품질 수준이 매출에 미치는 영향을 파악하기 위한 회귀분석모형. 독립변수는 서비스 수준과 품질 수준. 종속변수는 매출임.

 

(2) 이 자료 중 각 변수의 회귀계수의 유의확률은 어떠한지 설명하고, 이러한 유의확률이

어떤 통계적 의미를 갖는지 설명하시오. (허용유의수준 : 0.05) (4)

 품질수준점수의 유의확률은 0.000. 서비스수준점수의 유의확률은 0.005. 유의확률은 검정통계량의 관측값에 대하여 귀무가설을 기각할 수 있는 최소의 유의수준. 문제에서 각 변수의 회귀계수의 유의확률이 모두 허용유의수준보다 작은 값을 가지므로 두 독립변수 모두 매출 수준에 유의미한 영향을 미치고 있는 것으로 판단할 수 있음.

 

3) 독립변수 중 어느 변수가 더 높은 영향력을 가지며, 이러한 판단근거는 무엇인지 설명하시오. (5)

 

회귀계수를 비교해 보면, 품질수준의 영향력이 월등히 높은 것으로 해석할 수 있음. 단위의 영향을 고려하여 표준화회귀계수를 검토한 경우에도 품질수준의 영향력이 더 높은 것으로 나타남. 

 

(4) 회귀방정식을 도출하시오.(9)

매출액= 0.535 + 0.976 x 품질수준 + 0.251 x 서비스수준

 

(5) 만약 내년에 이 점포의 품질수준이 4, 서비스 수준이 5점이 될 경우 점포  예상매출액(금액단위 :억원)은 얼마인지 산출하시오.(5)

매출액= 0.535 + 0.976 x 4+ 0.251 x 5 = 5.694억원



2013문제 4 다중회귀분석에서 다중공선성의 개념을 설명하고, 통계적으로 다중공선성을 진단하는 2가지 방법에 대해 설명하시오. (10)

다중공선성은 3개 이상의 독립변수들간의 강한 선형관계를 보이는 현상으로 회귀계수의 계산을 불가능하게 만들거나 계산이 가능하더라도 회귀계수의 표준오차를 크게 부풀려 정확한 검정을 할 수 없게 함. 흔히 다음과 같은 경우 다중공선성이 있는 것으로 진단하게 됨.

독립변수간의 상관관계가 독립변수와 종속변수간의 상관관계보다 높은 경우.

회귀계수의 표준오차 값이 매우 큰 경우.

독립변수가 추가되거나 삭제되었을 때 회귀계수의 변화가 큰 경우.

일부 사례의 포함이나 배제와 같은 자료의 미미한 변화에도 회귀계수에 큰 변화를 보이는 경우 

회귀계수의 부호가 이론적으로 예측한 것과 반대로 나타나는 경우.

표준화회귀계수가 이론적으로 불가능한 값인 1.0보다 크거나 -1.0보다 작게 나타나는 경우

그 외 잔여분산과 고유근 분석을 통해 다중공선성 여부를 탐색함.

 

 

<회귀분석 핵심정리>

 

회귀분석 기출 문제중에 다중공선성이 출제된 바 있습니다. 다중공선성을 포함하여 회귀분석의 기본가정에 흠결이 있을 경우 발생가능한 문제는 아래와 같이 정리할 수 있습니다.


Posted by dooka
,