최근 구매 브랜드의 사용 만족도에 대한 예시자료를 이용해 척도형에 유용한 분할수직막대형 차트를 구성해 보겠습니다. 분석대상 파일을 열어서 최근 구매 브랜드 변수인 brand를 범주형으로 변경하고 명칭을 부여해 줍니다. y변수는 해당 브랜드의 사용만족도로 5점 만점등간척도입니다.

 

bar_chart_3.csv

 

 

table()함수와 prop.table()함수를 이용해 브랜드별 만족도 점수의 비율자료를 구합니다.

 

주어진 자료를 이용해 barplot()으로 분할수직막대형 차트를 그려 줍니다.

 

이번에는 qqplot()을 이용해 분할수직막대형 차트를 그려보겠습니다. 최근 구매 브랜드에 대한 만족도 자료를 불러 들인 후 최근 구매 브랜드 변수 brand를 범주형으로 변경해 줍니다. 차트를 작성할 때 매우 만족과 만족이 막대 그래프의 상단에 노출하게 하기 위해 원래의 만족도 변수 score 대신 5점을 1점으로, 4점을 2점으로 2점을 4점으로 1점을 5점으로 변경한 새로운 변수 score2를 사용하도록 하겠습니다. 이것은 차트를 원하는 형식으로 만들기 위한 편의적인 조치로 평균을 구하는 등의 분석 작업 시에는 변경 전 변수인 score를 사용해야 합니다.

 

bar_chart_4.csv

 

분할수직막대형 차트를 작성하기 위해 brand와 만족도를 리코드한 변수인 score2를 범주형으로 변경하고 명칭을 부여해 줍니다.

변경한 bar파일을 이용해 차트를 생성해줍니다. 일반 수직막대형 차트와는 달리 x축과 y축을 정의해주는 것 외에 분할수직막대형 그래프의 분할을 구분해줄 변수도 함께 지정해 주어야 합니다.

 

궁금하신 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변 드리겠습니다!

 

Posted by dooka
,

이표본 가설검정은 전체 표본을 무작위로 두개의 집단으로 구분한 후 각각 서로 다른 실험처리를 적용하는 방법으로 진행합니다. 그렇게 함으로써 두 집단의 동질성을 평균적으로 확보할 수 있습니다. 그러나, 다이어트 약의 효과 여부를 파악하는 경우와 같이 연령, 성별, 비만 정도가 동일한 실험대상을 찾기가 현실적으로 어렵습니다. 다이어트 약 효과를 파악하기 위해 이표본 가설검정을 적용한다면 다이어트 약의 임상 효과와 다른 제3의 요인에 의한 효과를 정확하게 분리하는 것이 곤란해 질 수 있습니다. 이런 경우에는 동일한 실험대상자를 하나의 쌍으로 보아 다이어트 약을 복용하게 해서 복용 후와 복용 전의 효과를 비교하는 쌍체 비교(Paired T test)를 활용하는 것이 정확한 다이어트 약의 효과를 파악하기 위해 좋은 방법입니다.  서로 다른 광고 시안 A와 B에 대한 소비자 호감도를 파악하기 위해 표본으로 추출한 소비자 전체에 대해 무작위로 광고 시안 A와 B를 모두 보여 주고 이들 광고시안에 대한 호감도의 차이를 알아 보는 방법 역시 쌍체 비교의 한 예입니다.

이제 표본크기가 200명이고 이들 응답자들에게 서로 다른 광고 시안 A와 B를 무작위로 노출한 후 호감도를 평가하여 얻은 가상의 데이터 cc를 이용해 쌍체 비교를 실행해 보겠습니다. 가상의 데이터에서 변수 X는 광고 시안 A에 대한 호감도, 변수 Y는 광고 시안 B에 대한 호감도이며 변수 Z는 X와 Y의 차이 X-Y 입니다. 쌍체 비교의 자료 입력 방식이 이표본 가설검정의 그것과는 차이가 있음에 유념해야 합니다.

 

 

 

가상의 데이터 cc를 이용해 R에서 쌍체 비교를 실시한 결과는 아래와 같습니다. p-value 값은 0.003으로 유의수준 0.05 하에서 광고 시안 A와 B의 호감도는 차이가 없다는 귀무가설에 대한 강력한 반증이 되므로 광고 시안 B의 호감도가 A에 비해 더 높은 것으로 판단할 수 있습니다.

 

 

광고 시안 A, B에 대한 예에서 쌍체 비교 시 자유도는 200-2=198이 되는 반면, 동일한 내용의 이표본 가설 검정에서의 자유도는 400-2-398이 됩니다. 쌍체 비교는 표본크기와 자유도의 손실로 귀무가설을 기각하는 검정력이 이표본 가설검정에 비해 감소합니다. 그러나, 쌍체 비교는 쌍으로 구획하여 광고 시안 이외에 광고 시안에 대한 호감도에 영향을 미치는 요인들이 쌍 내의 개체들에게 동일하게 영향을 미치므로 X-Y의 분산이 감소하고 모집단 표준편차의 추정값이 감소하여 검정력을 증가시킵니다. 그러므로 이표본 가설검정과 쌍체 비교는 설문조사를 위한 비용 및 시간과 함께 얼마나 효과적으로 쌍으로의 구획이 가능한지에 따라 판단할 문제입니다. 표본크기가 증가하면 비용이 상승하므로 시장조사 실무에서는 이표본 가설검정보다는 쌍체 비교를 위한 조사설계를 선호하는 편입니다.

 

궁금한 점이 있으면 아래 버튼을 클릭해 주십시오. 데이터테일즈가 성실하게 답변 드리겠습니다.

                                        

cc.csv

 

 

 

 

 

 

'야행하는 리서치' 카테고리의 다른 글

45. 분산분석 ②  (0) 2018.03.15
44. 분산분석 ①  (0) 2018.01.03
42. 이표본 가설검정 ③  (0) 2017.09.13
41. 이표본 가설검정 ②  (0) 2017.09.11
41. p-value  (0) 2017.09.11
Posted by dooka
,

SurveyMonkey 설문 결과 분석을 본격적으로 이용하기에 앞서 우선 완성도별 필터링에서 ‘전체 완성 응답’을 선택합니다. ‘전체 완성 응답’을 선택한 상태에서 결측치가 없는 , 완비된 데이터를 기준으로 설문조사 진행상황을 점검하고 설문 결과 분석도 ‘전체 완성 응답’을 기준으로 실시합니다. 만약, 특정 제품의 구매경험자를 대상으로 조사를 진행할 경우, 확률표본추출을 통해 조사대상자를 선정했다면 ‘전체 완성 응답’을 해제해서 탈락된 응답자까지 포함된 데이터를 보면 특정 제품 구매경험률을 추론해 볼 수 있습니다.

 

① 필터링 중 가장 자주 사용하는 기능은 ‘질문 및 답변 필터링’ 입니다. ‘질문 및 답변 필터링’은 질문 및 질문의 보기에 해당하는 데이터만을 선택할 수 있는 기능입니다. ‘질문 및 답변 필터링’은 아래에서 연령과 거주 지역을 동시에 선택한 것처럼 중복해서 적용할 수 있습니다.

② SurveyMonkey에서는 설문 응답 수집 수단을 컬렉터라고 하고 컬렉터별로 필터링을 적용할 수 있습니다. 컬렉터별 필터링은 영업점별로 고객만족도조사를 진행할 경우 영업점별로 컬렉터를 별도로 생성한 후 필터링 기능을 적용하면 손쉽게 영업점별 결과를 점검할 수 있습니다.

 

③ 조사 진행 기간별로도 데이터를 선택할 수도 있습니다. 고객만족도조사를 진행한다고 할 때 얼마나 신속하게 조사에 참여했는가는 조사대상 서비스나 조직에 대한 태도를 반영한다고 할 수 있습니다.

 

④ 그 외 총 응답 시간별로 응답을 선별할 수 있으며, IP주소, 이메일 주소, 이름, 사용자가 별도로 직접 정의한 직급 등

사용자 정의 데이터별로도 응답을 선별할 수 있습니다. 중복응답이나 불성실 응답을 선별할 때 편리한 기능입니다.

 

GOLD 계정 이상에서는 응답자를 무작위로 배치하여 각 응답자에게 서로 다른 이미지나 텍스트를 보여 줄 수 있는 무작위 할당 기능을 제공하고 있습니다. 무작위 할당을 적용한 질문에 대해서는 무작위 할당한 이미지나 텍스트 등 자극물별로 응답을 선별할 수 있습니다. 예를 들어 광고 제작물 A와 B에 대한 반응을 알아보기 위해 설문참여 응답자에 각각 50%의 확률로 광고 제작물을 무작위로 노출하고 설문조사를 진행한 후 핕터링 기능을 이용해 광고 제작물별로 조사결과를 볼 수 있습니다.

 

궁금하신 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변 드리겠습니다!

                                                       

 

Posted by dooka
,

수직막대형 차트에 비해 많이 활용하는 편은 아니지만 수평막대형 차트는 공간 활용 면에서 효율적인 측면이 있습니다. 수평막대형 차트에서는 차트를 보는 시선이 상하로 움직이게 되는데 이는 수직막대형 차트에서의 시선 이동보다는 다소 불편한 것입니다. 그러므로 수평막대형 차트에서는 가급적 시선의 흐름을 방해하는 안내선이나 테두리는 사용하지 않고 그래프의 배열은 크기 순서나 논리적 순서를 반드시 준수할 필요가 있습니다.

 

두 개의 수평막대형 차트를 비교할 경우에 가급적 비교 대상 차트들의 방향이 동일하도록 차트를 작성하는 것이 좋습니다. 비교를 목적으로 서로 반대 방향을 바라보는 수평막대형 차트를 그리면 차트를 바라보는 시선 흐름에 혼선이 생겨 차트를 읽는 사람이 불편을 느낄 수 있습니다.

궁금하신 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변드리겠습니다!

 

'마케팅 우라모드' 카테고리의 다른 글

개비스콘 광고 이야기  (0) 2019.06.22
Willingness to pay  (0) 2018.01.04
차트 작성 시 몇 가지 주의할 점들 ①  (0) 2017.07.26
카드결제 시 수수료 추가!  (0) 2017.07.17
판매원의 뒷모습을 보다  (0) 2017.04.24
Posted by dooka
,

서베이몽키 설문 결과 분석의 개별 문항의 편집 화면에서 ‘사용자 정의’ 메뉴를 선택하면 차트 유형과 기본적인 표시옵션 외에도 차트의 색상을 지정할 수 있습니다.

 

차트의 색상을 지정한 후에는 차트에 표시한 레이블을 변경할 수 있습니다. 차트의 레이블은 기본적으로 서베이몽키의 웹 설문에서 사용한 질문과 보기를 그대로 사용하므로 다소 길고 복잡할 수 있습니다. 서베이몽키의 설문 결과 분석의 차트 레이블 기능은 이럴 경우 매우 유용하게 사용할 수 있습니다.

궁금하신 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변 드리겠습니다!

 

Posted by dooka
,

대학의 광고홍보효과를 검증하는 조사에서는 대체로 ① 대학에 대한 인지수준 ② 대학의 성과 및 호감도 ③ 대학의 이미지(perceived image)와 포지셔닝 ④ 대학의 이미지 개선 방향 ⑤ 대학 광고·홍보물 크리에이티브의 R·O·I 평가 ⑥ 대학 광고·홍보물의 집행 경쟁력 ⑦ 대학 광고·홍보물의 세부 콘텐츠 평가 ⑧ 대학 광고·홍보물의 집행 매체 효율성 등을 다루게 됩니다.

① 대학에 대한 인지수준은 최초인지도(Top of Mind)을 포함한 비보조인지도(unaided total)과 해당 대학을 보여준 후 인지 여부를 확인하는(재인) 보조인지도(aided total)로 구분할 수 있습니다. 대체로 대학이 설립초기단계에 있다면 비보조인지도와 보조인지도 모두 낮은 수준에 머무르겠지만 시간이 경과할수록 비보조인지도와 보조인지도의 변화 방향이 달라지는 모습을 보일 것입니다.

 

② 대학별 입시경쟁률과 같이 현재의 성과와 향후 입학 의향 대학과 같이 미래의 성과를 나타내는 지표를 인지도를 기준으로 비교해 보면 현재 관심있는 대학이 어떤 상태에 있는지 확인할 수 있습니다.

 

③ 대학별로 주요 고객유형별 이미지 위상을 점검할 수 있습니다. 대학의 주요 고객으로는 학생, 학부모 및 기업 등을 고려할 수 있으며 대학의 발전이라는 관점에서 대학의 고객별로 중요하게 고려해야할 이미지는 다를 수 있습니다.

 

④ 경쟁 대학 대비 이미지 위상 차이와 대학 선택 시 고려비중 대비 적합도를 파악함으로써 대학의 이미지 개선 방향을 도출할 수 있다.

 

⑤ 대학 광고·홍보물에 대한 노출 호감도 외에 크리에이티브의 평가요소인 Relevance, Originality, Impact에 대한 평가를 통해 대학 광고·홍보물의 크리에이티브 특성을 점검하고 이를 근거로 ⑥ 대학 광고·홍보물의 집행 경쟁력을 점검할 수 있습니다.

 

⑦ 대학 광고·홍보물의 copy, model, BGM 및 tonality에 대한 평가 역시 진행할 수 있습니다.

 

⑧ 대학 광고·홍보물의 집행 매체의 접촉율과 접촉빈도를 점검함으로써 매체의 효율을 파악하고 매체전략에 반영할 수 있습니다.

설문조사를 의뢰하고 싶다면 아래 버튼을 눌러 주세요. 일반 문의도 환영합니다.

 

 

 

 

Posted by dooka
,

39. 이표본 가설검정 ①

41. 이표본 가설검정 ②

만약 표본크기가 크지 않다면 중심극한정리를 적용할 수 없으므로 모집단 분포가 정규분포를 따르는지 점검해야 합니다. R에서는 shapiro.test()명령으로 정규성 검정을 할 수 있습니다. 아래는 음료 제품에서 두종류의 향을 첨가하여 각각의 향에 대해 20명을 대상으로 각각호감도를 점검한 데이터 bb에 대해 정규성 검정을 실시한 결과입니다. p-value 값이 0.01로 데이터가 정규분포를 따른다고 보기 어렵고, t검정을 실시할 수 없습니다.

표본크기가 크지 않고 정규분포 모집단을 가정할 수 없다면 모집단 분포에 대해 특별한 가정을 전제로 하지 않는 비모수통계 방법을 적용합니다. 이표본 검정에 대응하는 비모수통계방법은 Wilcoxon 순위합 검정(Wilcoxon Rank-Sum Test) 입니다. Wilcoxon 순위합 검정을 실시하기 위해서는 원본 데이터 값을 사용하지 않고 그 순위를 데이터로 활용합니다. 원본 데이터 값이 클수록 순위 역시 큰 값을 가지도록 순위를 정하고 동점인 경우 동점인 값들의 평균 순위로 사용합니다. 예시 데이터 bb를 이용해 Wilcoxon 순위합 검정을 실시한 결과는 아래와 같고 음료제품의 서로 다른 향에 따른 호감도 차이는 없는 것으로 판단할 수 있습니다.

 

bb.csv

 

 

궁금한 점이 있으면 아래 버튼을 클릭해 주십시오. 데이터테일즈가 성실하게 답변 드리겠습니다.

                                                          

 

 

'야행하는 리서치' 카테고리의 다른 글

44. 분산분석 ①  (0) 2018.01.03
43. 독립표본의 검정과 쌍체 비교  (0) 2017.09.25
41. 이표본 가설검정 ②  (0) 2017.09.11
41. p-value  (0) 2017.09.11
40. 정규분포와 t분포  (0) 2017.09.06
Posted by dooka
,

39. 이표본 가설검정 ①

이제 예시 데이터에서 서로 다른 패키지에 대한 호감도에 차이가 있는지 알아보기 위해 t검정을 실시해 보겠습니다. 이미 앞서 설명한 바와 같이 표본크기가 증가하면 t분포는 정규분포에 근사하므로 R에서도 정규분포에 근거한 가설검정을 별도로 제공하지 않고 t분포에 근거한 가설검정 절차만을 제공하고 있습니다. R에서 분산이 동일한 경우 두집단의 표본평균 비교를 위한 명령은 아래와 같습니다. R은 대문자와 소문자를 구분함에 유념해야 합니다. 아래 예시 분석 결과를 보면 p-value가 0.014로 귀무가설을 기각할 수 있는 강력한 증거가 됨을 알 수 있습니다.

단측검정을 위해서는 t.test() 명령에 alt='less' 또는 alt='greater' 옵션을 추가하여 실행하면 됩니다. 분석결과는 대립가설이 패키지 A의 호감도가 패키지 B의 호감도보다 작다는 대립 가설을 전제한 분석결과입니다. p-value 값이 0.007 이므로 귀무가설에 대한 강력한 반증이 된다고 보아 패키지 A의 호감도가 패키지 B의 호감도에 비해 더 작다고 판단할 수 있습니다.

 

등분산 검정 결과 두 집단의 분산이 동일하지 않다고 판단한다면 t.test() 명령의 옵션에서 ‘var.equal=TRUE' 옵션을 제외하고 실행합니다.

 

aa.csv

 

궁금한 점이 있으면 아래 버튼을 클릭해 주십시오. 데이터테일즈가 성실하게 답변 드리겠습니다.

                                                       

 

'야행하는 리서치' 카테고리의 다른 글

43. 독립표본의 검정과 쌍체 비교  (0) 2017.09.25
42. 이표본 가설검정 ③  (0) 2017.09.13
41. p-value  (0) 2017.09.11
40. 정규분포와 t분포  (0) 2017.09.06
39. 이표본 가설검정 ①  (0) 2017.09.06
Posted by dooka
,

41. p-value

야행하는 리서치 2017. 9. 11. 09:00

귀무가설의 채택 여부를 결정하는 기준으로 통계분석프로그램에서 흔히 제시되는 값으로p-value가 입니다. p-value는 유의확률(significance probability)라고도 하는데, p-value는 검정통계량의 결과값에 대해 귀무가설을 기각할 수 있는 최소한의 유의수준을 말합니다. 만약 보다 작은 유의수준으로 귀무가설을 기각할 수 있다면 검정통계량의 결과값은 귀무가설 하에서 발생가능성이 보다 희박한 사건이 될 것이므로 p-value 값이 작을수록 대립가설에 대한 보다 강력한 증거가 됩니다. 즉 p-value는 설문조사의 결과가 대립가설을 반대하는 입증정도를 나타냅니다.

이미 주어진 유의수준 하에서 기각역을 계산할 수 있음에도 p-value를 제시하는 이유는 표본크기가 커질수록 표본의 표준편차 즉 표준오차가 작아지므로 미세한 차이도 구분이 가능해지고 실제 귀무가설이 참이건 거짓이건 상관없이 대부분의 경우에 귀무가설을 기각할 수 있기 때문입니다. 이러한 문제를 해결하기 위해 획일적인 유의수준을 제시하지 않고 의사결정자가 의사결정에 따른 오류 가능성을 어느 정도 받아 들이지에 따라 스스로 귀무가설의 기각여부를 판단할 수 있도록 p-value를 제시합니다.

 

궁금한 점이 있으면 아래 버튼을 클릭해 주십시오. 데이터테일즈가 성실하게 답변 드리겠습니다.

                                                     

 

 

Posted by dooka
,

정규분포의 표본분포 중 하나인 t-본포에 대해 알아보겠습니다. 통계분석 프로그램에서 가설검정을 흔히 t-검정이라고 지칭하고 있습니다. 그렇게 명명하는 이유는 정규분포와 t-분포 사이에 밀접한 관계가 있기 때문입니다. 만약 모집단 분포가 정확하게 정규분포를 따른다고 하면 표본평균을 표준화한 변수 Z에서 모집단의 분산을 제곱근한 표준편차 대신 표본의 표준편차를 대입한 새로운 변수 T는 자유도 n-1인 t분포를 따릅니다.

t분포는 정규분포와 마찬가지로 좌우대칭의 형태를 이루고 있으나 정규분포에 비해 극단치에 민감하여 정규분포에 비해 두꺼운 꼬리를 가지고 있습니다. 또한, t분포는 기본적으로 정규분포 모집단에서 표본크기가 작은 경우에 적용하기 위한 분포로서 표본크기가 증가하면 t분포는 정규분포에 근사합니다. t-분포는 정규분포 모집단의 표본분포이므로 t분포를 적용하기 위해서는 표본의 확률변수들의 분포가 정규분포에 적합해야 합니다.

우리는 앞에서 확률표본에서 표본크기가 증가하면 중심극한정리에 의해 근사적으로 Z는 평균이 0이고 분산이 1인 표준정규분포를 따름을 알았습니다. 그런데 표본크기가 증가하면 표본의 표준편차가 모집단의 표준편차에 근사하므로 모집단의 표준편차 대신 표본의 표준편차를 대입한 변수 역시 근사적으로 표준정규분포를 따르게 됩니다. 아래에서 A는 aymptotic의 약자로 근사적으로 해당 분포를 따른다는 의미입니다.

정규분포 모집단에서 표본크기가 작은 경우에는 t분포를 따르게 되고 표본크기가 증가하게 되면 t분포는 정규분포에 근사하므로 통계분석 프로그램에서는 구태여 정규분포에 근거한 검정과 t분포에 근거한 검정을 구분할 필요가 없습니다. 시장조사론 교재에서도 별 다른 구분 없이 t검정으로 통칭하는 경우가 많습니다. 물론 통계학 교재에서는 두 가지 경우를 준별하고 있습니다.

 

궁금한 점이 있으면 아래 버튼을 클릭해 주십시오. 데이터테일즈가 성실하게 답변 드리겠습니다. 

                                                     

 

 

Posted by dooka
,