분산분석은 독립변수로 구분하는 세 개 이상의 집단에 속한 종속변수의 평균에 차이가 있는지 검정하는 분석방법으로 원인이 되는 독립변수는 명목형이나 서열형 척도로 측정한 값이고 결과가 되는 종속변수는 등간척도나 비율척도로 측정한 값일 때 적용 가능합니다. 실험처리 요인인 독립변수가 하나인 경우를 특별히 일원분산분석법(일원배치법; one-way ANOVA)라고 합니다.

신제품 콘셉트 A, B, C에 대한 호감도의 차이를 알아보기 위한 일원분산분석 사례를 통해 분산분석에 대해 좀 더 알아보겠습니다. 일원분산분석법을 적용하기 위해서는 설문조사의 응답자들에게 무작위로 신제품 콘셉트 A, B, C를 노출함으로써 신제품 컨셉트 이외에 호감도에 영향을 미치는 요인이 여러 설문조사 응답자들에게 평균적으로 동일하게 작용하도록 제어하게 됩니다. 이런 의미에서 일원분산분석법을 완전확률화설계(Completely Randomized Design)라고도 하며, 일원분산분석법은 결국 서로 다른 k개의 모집단에서 서로 독립인 확률표본을 추출하는 것과 같습니다. 즉 일원분산분석법은 이표본 가설검정의 확장임을 알 수 있습니다.

일원분산분석법의 모집단 모형은 다음과 같이 설정할 수 있습니다. 오차항이 독립적이고 동일한 정규분포를 따르며 오차항의 평균은 0, 분산은 σ2이라고 해보겠습니다. 오차항의 기대값이 0이므로 관심 있는 독립변수 외의 다른 요인의 영향은 평균적으로 특정 방향으로의 경향성을 가지지 않는 비편향성을 보이며 독립변수의 수준에 관계없이 분산은 동일합니다.

제품 콘셉트별 호감도를 알아보기 위한 분산분석의 자료 구조는 아래와 같습니다. 콘셉트별 열에 해당하는 값들은 각 콘셉트에 대한 호감도 값들이며 제곱합은 각 제품 콘셉트 별로 개별 응답값에 각 제품 콘셉트별 호감도 평균을 차감하여 제곱한 후 그 값을 각 제품 콘셉트 별로 더한 값입니다.

 

만약 제품 콘셉트 간의 호감도에 차이가 있다면 집단 간의 분산 즉 전체 평균과 각 집단별 평균의 차이가 우연한 변동을 반영하는 집단 내 분산보다도 클 것입니다.

일원분산분석법에서는 집단 간 평균들의 분산과 집단 내 관측치들의 분산의 비율을 검정통계량으로 하여 집단 간 평균의 차이를 검정하게 됩니다. 검정통계량 F는 집단 간 분산/집단 내 분산=(집단 간 변량/자유도)(집단 내 변량/자유도)=(집단 간 제곱합/(집단의 수-1)]/[집단 내 제곱합/(전체표본크기-집단의 수)]로 정의하며, 검정통계량 F는 일원분산분석법의 가정과 F분포의 정의에 의해 F분포를 따르게 됩니다. 일원분산분석법의 검정통계량 F는 집단 간 분산과 집단 내 분산의 비율이므로 이 값이 크면 집단 간 평균의 차이가 있는 것으로 판단할 수 있습니다. 실제 조사 결과로부터 계산한 검정통계량 F값을 주어진 자유도와 유의수준 하에서의 임계치와 비교하여 계산한 F값이 임계치보다 크다면 집단 간 평균은 차이가 없다는 귀무가설에 대한 강력한 반증이라고 판단할 수 있습니다.

제품 콘셉트의 선호도에 대한 가상의 데이터 AA를 이용해 실제 일원분산분석법을 적용해 보았습니다. 아래 분산분석표에서 df는 자유도이고 sum sq는 제곱합을 의미합니다. mean sq는 제곱합을 자유도로 나눈 평균 제곱합합니다. 분산분석표에서 p-value가 0.0002로 나와 제품 콘셉트 후보들에 대한 호감도에는 차이가 있다고 판단할 수 있습니다.

이제 제품 콘셉트들의 호감도에 차이가 있다는 것이 밝혀졌으니 어떤 콘셉트의 호감도가 높은지 파악해 보겠습니다.. 그런데 단순한 이표본 검정절차를 사용하게 되면 유의수준을 제어할 수 없으므로 이러한 문제를 해결하기 위해 다양한 검정 절차가 개발되어 있습니다. 그 중 직관적으로 이해하기 쉬운 절차로는 Bonferroni 검정이 있습니다. Bonferroni 검정은 의사결정의 기준으로 개별적으로 허용한 유의수준을 검정한 횟수로 나눈 값을 활용하는 방법입니다. R에서 Bonferroni 검정을 수행한 결과 제품 콘셉트 후보 B와 C의 호감도 차이는 통계적으로 유의하지 않으며 A의 호감도가 다른 제품 콘셉트 후보에 비해 높은 것으로 나타났습니다.

          궁금한 점이 있으면 아래 버튼을 클릭해 주십시오. 데이터테일즈가 성실하게 답변 드리겠습니다.

 

'야행하는 리서치' 카테고리의 다른 글

47. 분산분석 ③  (0) 2018.05.07
46. 리서처가 바라본 빅 데이터  (0) 2018.03.15
44. 분산분석 ①  (0) 2018.01.03
43. 독립표본의 검정과 쌍체 비교  (0) 2017.09.25
42. 이표본 가설검정 ③  (0) 2017.09.13
Posted by dooka
,

서베이몽키에서는 설문조사 결과를 다운로드 받을 수 있는 내보내기 기능을 제공하고 있습니다.

 

내보내기 기능에서는 요약 데이터, 모든 응답 데이터와 모든 개별 응답의 세 가지 유형을 제공하고 있습니다. 모든 개별 응답은 모든 응답 데이터와 유사한 형태로 특정 기준에 해당하는 개별 응답을 다운로드 받을 수 있는 기능으로 활용도는 높지 않으므로 요약 데이터와 모든 응답 데이터에 대해서만 좀 더 자세히 알아보겠습니다.

 

요약 데이터는 개별 질문 문항의 결과에 대한 차트와 집계표로 요약한 파일을 다운로드 받을 수 있는 기능으로 PDF, PPT, XLS 및 CSV의 네 가지 유형의 데이터를 제공하고 있습니다.

 

PDF 형태의 요약 데이터는 하나의 파일에 응답 결과를 차트와 집계표 형태로 제공하고 있으며 자동으로 질문별로 페이지를 나눌 수 있습니다.

 

PPT 형태의 요약 데이터는 문항별 차트와 집계표를 슬라이드별로 제공합니다. 차트와 집계표는 이미지 파일 형태로 제공되므로 편집에는 한계가 있습니다.

 

xls 형태의 요약 데이터는 문항별 결과를 sheet로 나누어 제공합니다. xls 형태의 요약 데이터는 데이터와 차트의 편집이 가능하므로 활용도가 높은 편입니다.

 

모든 응답 데이터에서는 XLS, XLS+,SPSS와 PDF의 총 네가지 파일 형식을 지원하고있습니다. XLS 형식은 엑셀에서 활성화할 수 있으며, XLS+ 형식은 다양한 통계분석 프로그램에서 활용할 수 있습니다. SPSS 형식은 대표적인 통계분석 프로그램인 SPSS에서 활용할 수 있는 SAV파일을 제공합니다. XLS 형식에서 각 셀의 응답값 유형을 실제 답변 텍스트와 수치값 중 하나로 선택할 수 있습니다.

 

XLS 형식에서 실제 답변 텍스트를 선택하면 응답값의 이름(label)을 기준으로 개별 응답을 보여 줍니다. 실제 답변 텍스트를 선택하여 다운로드 받게 되면 변수의 측도가 모두 명목형이 되기 때문에 빈도 분석 외에 다른 분석을 적용하는데에는 한계가 있습니다.

XLS 형식에서 수치값을 선택하면 개별 문항별로 변수값으로 정의한 실제 수치(value)를 기준으로 응답을 보여줍니다. 실제 답변 텍스트를 선택한 경우와는 달리 각 문항별로 원래 정의한 측도의 속성에 따라 다양한 분석을 적용할 수 있습니다. 다만, 별도로 응답값(value)에 대응하는 명칭(label)를 별도로 할당하는 작업을 해주어야 합니다.

 

만약 SPSS를 기본 분석 프로그램으로 활용하고 있는 서베이몽키 사용자라면 SPSS 형식이 지원하는 SAV파일을 다운로드받으면 편리합니다. 처음부터 각 변수 응답값(value)에 대한 명칭(label)이 지정된 상태에서 SAV 파일을 제공하기 때문에 별도의 작업 없이 바로 데이터에 대한 에디팅 및 분석 작업을 시작할 수 있습니다. 학술 및 연구 등 필요에 의해 설문조사 결과를 분석해야 하지만 전문 설문조사 에이전시의 도움을 기대할 수 없는 경우에는 업무를 줄여주는 매우 편리한 기능입니다.

 

궁금하신 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변 드리겠습니다!

Posted by dooka
,

 

 

'House of Bones' 카테고리의 다른 글

House of Bones episode6  (0) 2018.05.13
House of Bones episode5  (0) 2018.05.13
House of Bones Episode4  (0) 2018.05.06
House of Bones Episode3  (0) 2018.05.06
House of Bones Episode1  (0) 2018.01.15
Posted by dooka
,

R을 이용하면 텍스트 형태의 데이터에서 키워드를 추출해 클라우드 형태로 제시할 수 있을 뿐만 아니라 키워드 간의 거리를 기준으로 상관관계를 점검해 키워드 간의 네트워크를 그려 볼 수 있습니다.

 

키워드 간의 관계를 파악하고 나면 이를 근거로 응답자 집단을 몇 개의 집단을 분류해 볼 수 있습니다. 이와 같이 텍스트형 데이터를 이용한 클러스터 분석에서도 집단의 특성을 반영한 명칭 부여는 분석자의 몫입니다.

 

데이터테일즈에 설문조사를 의뢰하시려면 아래 버튼을 눌러주세요. 일반 문의도 환영합니다.

Posted by dooka
,

 

 

 

'House of Bones' 카테고리의 다른 글

House of Bones episode6  (0) 2018.05.13
House of Bones episode5  (0) 2018.05.13
House of Bones Episode4  (0) 2018.05.06
House of Bones Episode3  (0) 2018.05.06
House of Bones Episode2  (0) 2018.01.26
Posted by dooka
,

마케팅 활동의 과정 중, 새로운 고객이 유입하면 고객 관리를 통해 고객을 유지하고 추가매출을 창출하려는 노력을 하게 됩니다. 이러한 노력을 지원하는 중요한 자료 중 하나가 고객만족도입니다. 그런데 고객만족도를 측정하는 것만으로는 고객을 유지하고 육성할 수 없습니다. 왜냐하면 장기적으로 생각해 볼 때 만족한 고객만이 재구매 혹은 재방문할 것이므로 고객의 이탈을 유발하는 결정적인 불만요인이 무엇인지 알기 어렵기 때문입니다. 이탈고객에 대한 추적조사가 가능하다면 이탈고객을 대상으로 조사를 실시하면 좋겠지만 실행이 쉽지 않습니다. 미리 기존 고객만족도와 함께 고객의 재구매의향을 점검해둔다면 고객유지에 많은 도움이 될 뿐만 아니라 만족도와 재구매의향을 기준으로 고객을 분류하여 그 구성을 살펴보면 우리의 고객 구성이 얼마나 안정적인지 점검할 수도 있습니다.

 

충성 고객은 만족도가 높아 재구매의향이 있는 고객 집단이라면 이탈 고객은 낮은 만족도로 조만간 탈퇴하거나 다음 구매에서는 다른 경쟁 제품으로 전환할 예정인 고객 집단이라고 할 수 있습니다. 기회주의적 고객은 높은 만족도에도 불구하고 재구매의향은 부정적인 고객 집단입니다. 노트북을 구매하는 대학생의 경우 정보탐색의 기회비용이 크지 않으므로 구매 전 정보수집활동이 일반 직장인에 비해 활발할 가능성이 크고 비록 기존 제품에 만족하더라도 추가적인 정보탐색활동을 통해 좀 더 저렴하거나 성능이 우수한 다른 제품을 구매할 수도 있을 것입니다. 기회주의적인 고객과는 달리 포획 고객은 낮은 만족도에도 불구하고 거래비용으로 인해 적어도 단기적으로는 경쟁사 제품이나 서비스를 구매하지 않고 계속 우리 제품서비스를 계속 구매할 의향이 있는 고객 집단을 말합니다. 포획 고객을 위해서는 최소한 거래비용을 능가하는 제품 및 서비스의 개선을 제공할 수 있어야 포획 고객이 장기적으로는 이탈 고객으로 진화하는 것을 방지할 수 있을 것입니다. 문제는 이렇게 고객만족도와 재구매의향 즉 고객충성도를 근거로 고객을 분류하여 관리하는 방법이 적절한 마케팅 전략상의 지침을 제공하는데 실패할 수도 있다는 점에 유념해야 합니다. 예를 들어 패션 쇼핑몰을 운영하는 기업이 고객을 지속적으로 점검해본 결과 이탈 고객과 포획 고객이 증가하는 경향을 보이고 있으며 이들이 판매 의류에 대해 가지는 가장 큰 불만은 의류의 색상 특히 낮은 채도에 있다는 것을 알아내고 이탈 고객들이 평균적으로 선호하는 채도 수준인 50 정도로 채도를 개선한 제품 라인을 출시했다고 가정해 보겠습니다. 그런데 실제로 이탈 고객 중 50%는 100 수준의 높은 채도를 선호하는 반면 나머지 50%는 극단적으로 낮은 채도 0의 색상을 선호하고 있다면 채도 50 정도의 제품 라인은 이탈 고객 중 누구에게도 호감을 얻지 못하고 급격한 매출 감소를 피할 수 없을 것입니다. 만약 미리 고객들의 색상에 대한 선호를 파악해 고객을 분류해 두었다면 낮은 채도를 선호하는 고객 집단과 높은 채도를 선호하는 고객 집단별로 이탈 고객을 관리하고 이탈 원인을 파악할 수도 있을 것입니다.

 고객만족도와 재구매의향 외에 추가할 수 있는 분류 기준은 우리에게 의미 있는 정보를 제공할 수 있는 기준이라면 어떤 것이라도 상관없습니다. 연령이나 소득, 직업 혹은 거주주택 형태, 위치 정보, 게시판에서의 의견, 혹은 정치인이라면 선거구 등 분류하여 수치화한 후 의미 있는 통찰력을 얻을 수 있는 것이라면 어떤 것도 무방합니다.

 예를 들어 근 미래에 드론을 이용한 배달에 집중하는 QSR(Quick Service Restaurant)을 생각해 보겠습니다. 이들은 서울 인근 경기도이 중소 도시에 A, B, C, D 총 네 개의 영업지역을 관리하고 있는데 이들 권역별로 각각 다른 특징을 가지고 있다고 가정해 보겠습니다. 가장 넓을 면적을 점유하고 있는 A 지역은 젊은 독신자 직장인들이 주로 거주하고 곳이고 B 지역은 그 도시의 중심가로 비교적 소득이 높은 중산층이 주로 거주하는 지역이라고 해보겠습니다. 지역 내 여자대학이 위치한 C 지역은 젊은 20대 여성이 주로 거주하고 곳이고 D 지역은 연령대가 높고 가용소득이 많지 않은 고령층이 주로 거주하고는 지역이라고 해보겠습니다.

이들 네 지역의 고객을 분석해 본 결과 이들 네 지역의 고객 구성은 아래와 같다는 사실을 알았습니다.

 

 

B 지역은 충성 고객의 비중이 높아 고객 유지가 주요 과제인 반면, 이탈 고객과 포획 고객의 비중이 높은 A, C, D 지역은 고객 이탈을 방지하기 위한 대책 마련이 시급한 상황입니다. 특이 이탈 고객의 비중이 높은 A 지역과 D 지역이 특히 문제가 될 것입니다.

 젊은 직장인이 많은 A 지역의 경우, 많은 비중을 차지하는 이탈 고객은 배달의 신속성에 불만을 많이 가지고 있는 바 이들의 라이프스타일을 점검해 다소간의 손실을 감수하더라도 미리 배달 음식을 준비해서 배달 시간을 줄이는 방안을 모색하는 것도 한 방법일 것입니다. 독신인 젊은 직장인의 특성 상 배달 음식을 이용하는 경우가 빈번하다면 더욱 적극적으로 고려해 볼만 할 것입니다.

 

 

소득이 비교적 높은 B 지역의 경우에는 식재료의 품질에 대한 우려가 있는 만큼 우수하고 안전한 식재료를 엄선한 프리미엄 메뉴를 개발해 제공하는 것도 고려할 수 있을 것입니다. 배달에 이용하는 드론의 품질 역시 개선하여 배달하는 동안의 신선도 유지 기능을 강화해 기존 경쟁사들은 제공하지 못하는 풍미의 메뉴를 제공할 수도 있을 것입니다.

 

 

여자대학교가 위치한 C지역에서 다수를 점하고 있는 포획 고객의 경우 메뉴의 다양성에 대한 평가가 상대적으로 낮은 모습을 보이고 있으므로 샐러드, 제과류 등 메뉴의 다양화를 시도하는 한편 샘플러 메뉴를 개발하여 제공할 수도 있을 것입니다.

 

고령층이 많은 D지역의 경우에는 가격에 대한 불만이 많으므로 할인쿠폰이나 오전 시간 할인 등 고령층을 겨냥한 다양한 할인 및 판촉 프로그램을 실행할 수도 있을 것입니다.

 

물론 가용한 재정적 자원은 제한적이므로 여러 가지 활동 중 기대 수익이 높은 활동부터 순차적으로 실행해야 할 것입니다.

실제로는 시장지배적인 기업은 모든 면에서 우수한 평가를 받는 반면 도전 기업은 항상 부족한 평가를 받기 마련이고 아무리 고객을 분류해서 분석해 보아도 전체적인 저평가 기조에는 변화가 없거나 보완이 필요한 부분이 나오더라도 단기적으로는 적절한 대책이 없는 경우도 있습니다. 그러나 접근 가능한 고객 관련 데이터의 양적 측면이나 분석 가능성이라는 질적 측면에서 비약적인 도약이 있는 만큼 끊임없이 고객에 대한 애정 어린 이해를 중단하지 말아야 할 것이고 만약 유통과 물류, 매체에 대한 장악력이 높지 못해 전선을 넓힐 수 없는 입장이라면 단 하나의 점에 조직의 역량을 집중하는 차별화 노력도 고려할 만합니다.

 

데이터테일즈에 설문조사를 의뢰하시려면 아래 버튼을 눌러주세요. 일반 문의도 환영합니다.

 

 

 

 

Posted by dooka
,

설문조사를 하다보면 ‘willingness to pay’라는 단어를 가끔 듣게 됩니다. ‘willingness to pay’는 대체로 시장조사보다는 공공 서비스 관련 조사에서 조금 더 자주 접하는 단어입니다. 시장조사에서는 가격이라는 직관적인 단어가 일반적입니다. 사실은 두 단어는 거의 동일한 의미로 이해해도 무방한데 공공 서비스 분야에서는 공공재라는 특징 때문에 가격보다는 willingness to pay라는 좀 더 보편적인 용어를 사용하게 되는 것 같습니다.

‘willingness to pay’는 소비자 혹은 고객이 한 단위의 재화나 서비스를 이용하기 위해 지불할 의사가 있는 최대가격을 말합니다. 구태여 그냥 가격이 아닌 최대가격이라고 말하는 이유는 ‘willingness to pay’가 소비자의 효용극대화로부터 나온 개념이기 때문입니다. ‘willingness to pay’의 개념 속에는 주어진 예산 제약 하에서 소비자가 자신의 효용을 극대화하기 위해서는 최대한 이 가격만큼 지불할 의사가 있다는 의미가 담겨 있습니다. 아래와 같은 효용극대화 문제를 생각해보면, X재의 가격이 하락했을 때 효용극대화를 추구하는 소비자는 주관적 교환비율인 한계대체율(MRS :Marginal Rate of Substitution)이 객관적 교환비율인 상대가격과 일치하는 E1에서 소비를 결정하게 됩니다. 이를 X재라는 관점에서 대범하게 이야기해본다면 X재의 가격이 X재 소비로 인한 한계편익(MB :Marginal Benefit)과 일치할 때까지 X재의 소비를 증가시킬 때 주어진 예산 하에서 개별 소비자의 효용이 극대화된다고 이야기할 수 있습니다. 이때의 가격은 소비자가 효용 극대화를 추구할 때 지불할 의사가 있는 최대가격이 됩니다. 만약 이 가격보다 더 작은 가격으로 구매가 가능하다면 소비량을 늘려 자신의 효용을 증가시킬 수 있고 만약 주어진 가격보다 더 높은 가격을 지불하면 본인의 순편익이 負의 값을 가지므로 X재의 소비량을 줄여야 합니다.

시장에서는 가격차별화가 존재하지 않은 한 모든 소비자들은 주어진 가격 하에서 본인의 효용을 극대화하도록 소비에 대한 의사결정을 내린다고 보면 가격을 기준으로 개별 소비자의 수요함수를 수평으로 합하면 시장수요를 얻을 수 있을 것입니다.

그런데 이러한 접근이 공공 부문에서는 불가능할 수도 있습니다. 왜냐하면 공공 서비스의 경우 가격이 사회적 선호를 조절하는 신호로 작용할 수 있는 시장이 존재하지 않을 수도 있기 때문입니다. 공공 서비스 시장이 존재하기 힘든 이유는 공공 서비스의 특성에서 찾을 수 있습니다. 관념적으로만 생각해본다면 공공재(public goods)는 소비의 비경합성과 배제불가능성을 그 특성으로 하고 있습니다. 물론 현실의 공공 서비스가 가지는 비경합성과 배제불가능성의 정도에는 차이가 있을 수 있고, 경우에 따라서는 민간에서 공급하는 서비스와 동일한 성질을 지닌 서비스도 있을 수 있습니다.

공공재의 비경합성이란 하나의 소비자가 그 제품 혹은 서비스를 소비하는 것이 다른 소비자의 소비에 영향을 미치지 않는다는 뜻입니다. 예를 들어 섬과 육지를 연결하는 다리를 생각해보면 교통 혼잡이 없는 상황이라면 나의 통행이 다른 사람의 통행을 방해하기는 어려울 것입니다. 또한 공공재의 배제불가능성이란 비용을 지불하지 않았다고 해서 비용을 지불하지 않은 소비자가 해당 공공재를 소비하는 것을 막을 수 없다는 의미입니다. 지방자치단체의 지방소득세를 체납한 주민이라고 해서 해당 지자체가 건설한 다리를 못 건너가게 할 방법은 현재의 기술 수준에서 생각하기가 조금 곤란할 것입니다.

이러한 공공재의 특성으로 인해 일반적으로 공공재는 정부 등 공공부문이 주어진 양을 공급하고 개별 소비자, 주민 혹은 국민은 서로 다른 비용을 부담하게 됩니다. 즉 가격을 기준으로 개별 소비자의 수요함수를 수직으로 합하여 해당 공공재의 수요곡선을 도출하게 됩니다. 그런데 문제는 원래 시장이 잘 형성되지 않으므로 가격정보를 이용해 공공재에 대한 수요를 파악하기 어렵다는 점입니다. 이런 문제로 인해 공공사업의 타당성을 검토하기 위한 비용편익분석의 한 과정으로 공공사업이 제공하는 편익 또는 기대효과에 대한 willingness to pay를 알아내기 위한 설문조사를 종종 실시하게 됩니다. 이에 대해서는 관련 학계의 노력으로 표준적인 절차가 마련되어 있으며 가급적 예산이 허락하는 범위 내에서는 이러한 절차를 따르는 것이 타당할 것입니다. 일반적으로 본다면 공공 부문에서 willingness to pay를 파악하는 조사는 민간 조사에서의 가격조사와 마찬가지로 설문조사의 응답자가 가급적이면 가장 낮은 가격을 선택하여 자신의 선호를 과소 표출하려는 경향성이 있다는 문제와 함께 과연 조사대상자가 해당 공공사업이 제공하는 편익을 제대로 평가할 정도의 지식과 정보 및 경험이 있는가라는 문제가 발생합니다.

지방자치단체와 중앙정부 등 다양한 공공기관들이 제공하는 모든 재화와 서비스가 모두 공공재적 특성을 지닌 것은 아니지만 적어도 어떤 부문은 공공재적 특성이 있을 것입니다. 원래 시장이 공급하기 곤란한 재화와 서비스를, 비효율적이라는 이유로 일부 과점 기업에게 공급하게 하자는 주장에는 쉽게 동조할 수 없는 것입니다.

궁금하신 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변드리겠습니다!

 

 

 

 

Posted by dooka
,

지난 포스팅에서 우리는 이표본에서의 모평균 비교에 대한 가설검정을 알아보았습니다. 그렇다면 비교 대상이 두 집단보다 커지는 경우에는 어떤 분석이 가능할지 생각해고자 합니다. 고등학생들을 대상으로 한 스터디 카페를 운영하는 기업에서 광고 모델 후보로 유명 연예인 A와 교육 전문가 B, 그리고 고등학생 자녀를 둔 일반 학부모 C를 고려하고 있으며 고등학생 자녀를 둔 학부모를 대상으로 설문조사를 실시하고 그 결과에 따라 A, B, C 중 한 명을 광고 모델로 선정하기로 했다고 가정해 보겠습니다.

 이들 후보 A, B, C에 대한 호감도에 차이가 있는지 여부를 알아보기 위해 각각 이표본 가설검정 절차를 적용한다면 A와 B, A와 C, B와 C를 비교한 총 3회의 가설검정 절차를 거쳐야 합니다. 각각의 검정 절차에서 유의수준을 5%로 제어할 경우, 총 3회의 가설검정에서 단 한번이라도 잘못해서 귀무가설을 기각할 제1종 오류를 범할 확률은 5%를 상회합니다.

 각각의 검정에 대해 제1종 오류를 범할 확률의 상한인 유의수준이 5%라고 하면 귀무가설이 참일 때 귀무가설을 기각하지 않을 확률의 최소 95%가 되고 총 세 가지의 검정별로 귀무가설이 참일 때 가능한 의사결정 유형의 확률을 정리해 보면 좋은 의사결정이 되기 위해서는 세 가지 의사결정에서 모두 귀무가설이 참일 때 귀무가설을 기각하지 말아야 하고 이 확률은 95%가 아니라 95%×95%×95%=86% 입니다. 또한, 검정 절차 중 어느 하나라도 잘못해서 귀무가설을 기각할 확률은 14%에 이르게 됩니다. 이처럼 세 집단 이상인 경우 이표본 가설검정 절차를 적용하면 가설검정의 오류를 관리하는 것이 쉽지 않습니다.

 

                                                  

 

 세 집단 이상 비교에서 가설검정의 오류를 효율적으로 제어할 수 있는 분석 방법이 동시검정이 가능한 분산분석(ANOVA; Analysis of Variance)입니다. 분산분석은 독립변수로 구분하는 세 개 이상의 집단에 속한 종속변수의 평균에 차이가 있는지 검정하는 분석방법으로 원인이 되는 독립변수는 명목형이나 서열형 척도로 측정한 값이고 결과가 되는 종속변수는 등간척도나 비율척도로 측정한 값일 때 적용 가능합니다.

궁금한 점이 있으면 아래 버튼을 클릭해 주십시오. 데이터테일즈가 성실하게 답변 드리겠습니다.

 

 

 

 

 

 

 

 

 

 

'야행하는 리서치' 카테고리의 다른 글

46. 리서처가 바라본 빅 데이터  (0) 2018.03.15
45. 분산분석 ②  (0) 2018.03.15
43. 독립표본의 검정과 쌍체 비교  (0) 2017.09.25
42. 이표본 가설검정 ③  (0) 2017.09.13
41. 이표본 가설검정 ②  (0) 2017.09.11
Posted by dooka
,

서베이몽키(SurveyMonkey) 플래티넘 계정 사용자는 분석 기능에서 주관식 문항을 자동으로 분석할 수 있는 텍스트분석 기능을 사용할 수 있습니다.

 

서베이몽키 텍스트분석에서는 클라우드 뷰와 목록 뷰의 두가지 기능을 제공하고 있습니다. 클라우드 뷰에서는 주관식 응답의 내용을 워드 클라우드의 행태로 보여줍니다. 서베이몽키 텍스트 분석의 또 다른 기능인 목록 뷰에서는 차트 형태로 주관식의 응답 내용을 볼 수 있습니다.

 

또한, 주관식 응답을 리코드하여 볼 수 있는 분류 기능도 제공하고 있습니다.

궁금하신 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변 드리겠습니다!

Posted by dooka
,

서베이몽키(SurveyMonkey)에서 필터링은 SPSS와 같은 통계분석 프로그램에서 select 기능에 해당하는 것으로 특정 조건에 해당하는 데이터만을 추출하는 기능이라면, 비교(compare) 기능은 교차분석표(cross table)에 대응하는 것으로 특정 조건에 해당하는 결과들을 비교하는 기능입니다.

 

서베이몽키(SurveyMonkey) 분석 페이지 좌측 메뉴에서 ‘비교’를 선택하면 ‘질문 및 답변별 비교’와 ‘A/B 테스트별 비교’의 두 가지의 비교 기능 중 하나를 활용할 수 있습니다.

이 중 좀 더 자주 사용하는 ‘질문 및 답변별 비교’을 선택해 보면 비교하고자 하는 질문과 그 질문의 답변을 지정할 수 있습니다. 아래 사례는 ‘비교’ 기능을 이용해 20대, 30대, 40대의 연령별 만족수준을 비교하는 차트를 구성한 예시입니다.

 

최종적으로 연령별 만족도 수준을 비교한 차트는 아래와 같은 형태가 됩니다. 차트의 유형을 지정해서 원하는 형태의 차트로 연령별 만족도를 비교할 수 있습니다.

 

궁금하신 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변 드리겠습니다!

Posted by dooka
,