서베이몽키(SurveyMonkey)에서 필터링은 SPSS와 같은 통계분석 프로그램에서 select 기능에 해당하는 것으로 특정 조건에 해당하는 데이터만을 추출하는 기능이라면, 비교(compare) 기능은 교차분석표(cross table)에 대응하는 것으로 특정 조건에 해당하는 결과들을 비교하는 기능입니다.

 

서베이몽키(SurveyMonkey) 분석 페이지 좌측 메뉴에서 ‘비교’를 선택하면 ‘질문 및 답변별 비교’와 ‘A/B 테스트별 비교’의 두 가지의 비교 기능 중 하나를 활용할 수 있습니다.

이 중 좀 더 자주 사용하는 ‘질문 및 답변별 비교’을 선택해 보면 비교하고자 하는 질문과 그 질문의 답변을 지정할 수 있습니다. 아래 사례는 ‘비교’ 기능을 이용해 20대, 30대, 40대의 연령별 만족수준을 비교하는 차트를 구성한 예시입니다.

 

최종적으로 연령별 만족도 수준을 비교한 차트는 아래와 같은 형태가 됩니다. 차트의 유형을 지정해서 원하는 형태의 차트로 연령별 만족도를 비교할 수 있습니다.

 

궁금하신 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변 드리겠습니다!

Posted by dooka
,

최근 구매 브랜드의 사용 만족도에 대한 예시자료를 이용해 척도형에 유용한 분할수직막대형 차트를 구성해 보겠습니다. 분석대상 파일을 열어서 최근 구매 브랜드 변수인 brand를 범주형으로 변경하고 명칭을 부여해 줍니다. y변수는 해당 브랜드의 사용만족도로 5점 만점등간척도입니다.

 

bar_chart_3.csv

 

 

table()함수와 prop.table()함수를 이용해 브랜드별 만족도 점수의 비율자료를 구합니다.

 

주어진 자료를 이용해 barplot()으로 분할수직막대형 차트를 그려 줍니다.

 

이번에는 qqplot()을 이용해 분할수직막대형 차트를 그려보겠습니다. 최근 구매 브랜드에 대한 만족도 자료를 불러 들인 후 최근 구매 브랜드 변수 brand를 범주형으로 변경해 줍니다. 차트를 작성할 때 매우 만족과 만족이 막대 그래프의 상단에 노출하게 하기 위해 원래의 만족도 변수 score 대신 5점을 1점으로, 4점을 2점으로 2점을 4점으로 1점을 5점으로 변경한 새로운 변수 score2를 사용하도록 하겠습니다. 이것은 차트를 원하는 형식으로 만들기 위한 편의적인 조치로 평균을 구하는 등의 분석 작업 시에는 변경 전 변수인 score를 사용해야 합니다.

 

bar_chart_4.csv

 

분할수직막대형 차트를 작성하기 위해 brand와 만족도를 리코드한 변수인 score2를 범주형으로 변경하고 명칭을 부여해 줍니다.

변경한 bar파일을 이용해 차트를 생성해줍니다. 일반 수직막대형 차트와는 달리 x축과 y축을 정의해주는 것 외에 분할수직막대형 그래프의 분할을 구분해줄 변수도 함께 지정해 주어야 합니다.

 

궁금하신 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변 드리겠습니다!

 

Posted by dooka
,

이표본 가설검정은 전체 표본을 무작위로 두개의 집단으로 구분한 후 각각 서로 다른 실험처리를 적용하는 방법으로 진행합니다. 그렇게 함으로써 두 집단의 동질성을 평균적으로 확보할 수 있습니다. 그러나, 다이어트 약의 효과 여부를 파악하는 경우와 같이 연령, 성별, 비만 정도가 동일한 실험대상을 찾기가 현실적으로 어렵습니다. 다이어트 약 효과를 파악하기 위해 이표본 가설검정을 적용한다면 다이어트 약의 임상 효과와 다른 제3의 요인에 의한 효과를 정확하게 분리하는 것이 곤란해 질 수 있습니다. 이런 경우에는 동일한 실험대상자를 하나의 쌍으로 보아 다이어트 약을 복용하게 해서 복용 후와 복용 전의 효과를 비교하는 쌍체 비교(Paired T test)를 활용하는 것이 정확한 다이어트 약의 효과를 파악하기 위해 좋은 방법입니다.  서로 다른 광고 시안 A와 B에 대한 소비자 호감도를 파악하기 위해 표본으로 추출한 소비자 전체에 대해 무작위로 광고 시안 A와 B를 모두 보여 주고 이들 광고시안에 대한 호감도의 차이를 알아 보는 방법 역시 쌍체 비교의 한 예입니다.

이제 표본크기가 200명이고 이들 응답자들에게 서로 다른 광고 시안 A와 B를 무작위로 노출한 후 호감도를 평가하여 얻은 가상의 데이터 cc를 이용해 쌍체 비교를 실행해 보겠습니다. 가상의 데이터에서 변수 X는 광고 시안 A에 대한 호감도, 변수 Y는 광고 시안 B에 대한 호감도이며 변수 Z는 X와 Y의 차이 X-Y 입니다. 쌍체 비교의 자료 입력 방식이 이표본 가설검정의 그것과는 차이가 있음에 유념해야 합니다.

 

 

 

가상의 데이터 cc를 이용해 R에서 쌍체 비교를 실시한 결과는 아래와 같습니다. p-value 값은 0.003으로 유의수준 0.05 하에서 광고 시안 A와 B의 호감도는 차이가 없다는 귀무가설에 대한 강력한 반증이 되므로 광고 시안 B의 호감도가 A에 비해 더 높은 것으로 판단할 수 있습니다.

 

 

광고 시안 A, B에 대한 예에서 쌍체 비교 시 자유도는 200-2=198이 되는 반면, 동일한 내용의 이표본 가설 검정에서의 자유도는 400-2-398이 됩니다. 쌍체 비교는 표본크기와 자유도의 손실로 귀무가설을 기각하는 검정력이 이표본 가설검정에 비해 감소합니다. 그러나, 쌍체 비교는 쌍으로 구획하여 광고 시안 이외에 광고 시안에 대한 호감도에 영향을 미치는 요인들이 쌍 내의 개체들에게 동일하게 영향을 미치므로 X-Y의 분산이 감소하고 모집단 표준편차의 추정값이 감소하여 검정력을 증가시킵니다. 그러므로 이표본 가설검정과 쌍체 비교는 설문조사를 위한 비용 및 시간과 함께 얼마나 효과적으로 쌍으로의 구획이 가능한지에 따라 판단할 문제입니다. 표본크기가 증가하면 비용이 상승하므로 시장조사 실무에서는 이표본 가설검정보다는 쌍체 비교를 위한 조사설계를 선호하는 편입니다.

 

궁금한 점이 있으면 아래 버튼을 클릭해 주십시오. 데이터테일즈가 성실하게 답변 드리겠습니다.

                                        

cc.csv

 

 

 

 

 

 

'야행하는 리서치' 카테고리의 다른 글

45. 분산분석 ②  (0) 2018.03.15
44. 분산분석 ①  (0) 2018.01.03
42. 이표본 가설검정 ③  (0) 2017.09.13
41. 이표본 가설검정 ②  (0) 2017.09.11
41. p-value  (0) 2017.09.11
Posted by dooka
,