'House of Bones' 카테고리의 다른 글

House of Bones episode9  (0) 2018.07.09
House of Bones Episode8  (1) 2018.05.20
House of Bones episode6  (0) 2018.05.13
House of Bones episode5  (0) 2018.05.13
House of Bones Episode4  (0) 2018.05.06
Posted by dooka
,

국내에서는 패널나우를 운영하고 있는 다국적 리서치 솔루션 및 패널 제공사인 dataSpring은 고객들을 위해 유료로 인터넷 설문조사 진행을 위한 forSurvey 솔루션을 제공하고 있습니다.

forSurvey에서는 개별 설문조사를 Survey라고 하며 몇 개의 Survey를 Project로 묶어 관리하기 때문에 설문조사를 해당하기 위해서는 먼저 Project를 생성해 주어야 합니다.

 

Project를 생성한 후에는 개별 Survey를 만들어주면 실제 설문조사를 진행할 준비가 완료됩니다. 할당량을 지정하지 않을 경우에는 Research Type에서 Main을 선택하고 할당량 설정이 필요하면 SC & Main을 선택하면 됩니다. Exclude Dupulicates에서는 중복참여 제한 기준을 지정해 주고, Languages에서는 welcome page나 에러 메시지 등에서 사용할 언어를 선택할 수 있습니다.

궁금하신 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변 드리겠습니다!

 

Posted by dooka
,

Google에서는 Google Analytics Solutions 중 하나로 패널을 이용해 설문조사를 진행할 수 있는 Google Surveys 서비스를 제공하기 시작했습니다. 구글에서 Google Surveys를 검색해보면, 기존 구글 독스 외에 Google Surveys를 별도로 제공하고 있음을 확인할 수 있습니다.

 

 

Google Surveys에서는 현재 우리나라를 비롯해 59개국 응답자를 대상으로 설문조사를 실시할 수 있습니다. Google Surveys가 제공하는 샘플링 방법에는 편의 샘플링과 대표 샘플링이 있는데 우리나라의 설문조사에서는 편의 샘플링이 사용됩니다. 편의 샘플링은 선착순으로 설문을 진행하기 때문에 인구통계적 특성별로 고른 표본을 얻기 어렵습니다. 비용은 표본당 1문항 기준 0.1달러부터 최대 1.5 달러 정도이고, 응답자당 10문항까지만 질문할 수 있습니다.

 

Google Surveys에서는 총 13개의 설문유형을 이용할 수 있으며, 이 중 동영상 삽입 기능은 안드로이드에서만 가능합니다. 기본적으로 응답자 선정 기능(filtering)을 제공하고 있으며 보기를 무작위 순서로 노출할 수도 있습니다.

 

Google Surveys는 비록 문항 수의 제한이 있고 인구통계적 특성별로 고른 표본을 얻기가 어렵지만 비용을 고려한다면 의사결정에 필요한 정보를 얻기 위한 대안으로 고려할 수 있을 것 같습니다.

궁금하신 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변 드리겠습니다.

 

 

 

 

 

Posted by dooka
,

 

 

'House of Bones' 카테고리의 다른 글

House of Bones Episode8  (1) 2018.05.20
House of Bones Episode7  (0) 2018.05.20
House of Bones episode5  (0) 2018.05.13
House of Bones Episode4  (0) 2018.05.06
House of Bones Episode3  (0) 2018.05.06
Posted by dooka
,

 

 

 

 

'House of Bones' 카테고리의 다른 글

House of Bones Episode7  (0) 2018.05.20
House of Bones episode6  (0) 2018.05.13
House of Bones Episode4  (0) 2018.05.06
House of Bones Episode3  (0) 2018.05.06
House of Bones Episode2  (0) 2018.01.26
Posted by dooka
,

데이터를 분석하다 보면 입력내용이 없을 경우, 이것을 ‘null’로 처리할지 아니면 ‘0’으로 처리할지 고민해야 할 때가 있습니다. 우선 ‘null'과 ’0‘값을 구분해 보도록 하겠습니다. 'null'은 말 그대로 입력값이 없기 때문에 분석 시 사례에 포함하지 않고, ’0‘값은 사례에 포함하여 데이터 분석에 반영해야 합니다. 아래 데이터를 보면 ’0‘값을 포함한 A2 변수에서는 ’0‘값을 포함하여 평균을 계산한 반면, null'이 있는 A1 변수에서는 평균 계산 시 'null'인 사례를 제외하고 평균을 계산함을 확인할 수 있습니다.

 

’null'과 ‘0'을 구분하여 데이터를 처리하는 기준은 의사결정에 필요한 정보가 무엇인가 될 것입니다. 사례를 통해 좀 더 자세히 알아보겠습니다. 가상의 지방자치단체 A시와 B시가 있고 A시와 B시에는 각각 10개의 협동조합이 있다고 가정해 보겠습니다. A시와 B시에 있는 협동조합들의 경력단절 여성 고용현황은 아래와 같습니다. 협동조합 전체 근로자 중 10%가 근무하기 전 경력단절 여성이었음을 알 수 있습니다.

 

이제 ‘0’으로 처리하는 경우와 ‘null’로 처리하는 경우와 로 나누어 A시와 B시의 경력단절 여성 근로자 평균 인원을 비교해 보겠습니다. 먼저 경력단절 여성을 고용하지 않은 경우 ‘0’을 입력하고 데이터를 분석해 보면, 경력단절 여성 근로자 수를 전체 근로자 수로 나눠 산출한 경력단절 여성 고용율은 A시와 B시 모두 10%임을 확인할 수 있습니다.

 

만약 사회적협동조합의 경력단절여성 고용 촉진을 고려하고 있는 A시와 B시의 정책담당자들은 경력단절여성 고용율 평균만을 의사결정을 위한 정보로 활용한다면 정책 방향의 차이가 별로 없을 것입니다.

 

이와 같이 경력단절여성을 고용하지 않은 경우에 '0'값으로 처리하는지 아니면 ‘null'값으로 처리하는지에 따라 A시와 B시의 사회적협동조합 경력단절여성 고용율이 차이가 큰 이유는 조합별 경력단절여성 고용 인원 수 뿐만 아니라 경력단절여성을 고융한 사회적협동조합의 수에도 차이가 크기 때문입니다.

경력단절여성을 고용하지 않은 경우를 'null'로 처리했을 때 A시와 B시의 차이는 사회적협동조합의 경력단절여성 고용 촉진을 위한 정책 처방 역시 A시와 B시가 달라야 함을 시사합니다. 그러므로 경력단절여성 비고용인 경우에 ‘0’으로 처리하여 경력단절여성 고용율 평균마을 제시할 것이 아니라 경력단절여성 고용 여부와 경력단절여성을 고용한 사회적 협동조합의 경력단절여성 근로자의 인원 현황을 함께 제시하는 것이 바람직합니다.

 

A시는 전체 사회적협동조합의 80%가 경력단절여성을 고용하고 있으며, 경력단절여성을 고용한 협동조합의 경력단절여성 근로자 인원 평균은 1.3명입니다. 반면, B시는 전체 사회적협동조합의 20%만이 경력단절여성을 고용하고 있지만, 경력단절여성을 고융한 협동조합의 경력단절여성 근로자 인원 평균은 5명입니다.

 

이를 근거로 보면 A시가 사회적협동조합의 경력단절여성 고용을 촉진하기 위해서는 경력단절여성을 이미 채용하고 있는 사회적협동조합의 추가 고용을 축진할 수 있는 정책처방이 필요한 반면,B시의 경우는 사회적협동조합의 경력단절여성 신규채용을 촉진할 수 있는 정책처방이 필요함을 알 수 있습니다.

이와 같이 데이터를 분석하기 전에 결측값을 ‘null'로 처리할지, ’0‘로 처리할지 여부는 의사결정을 위해 제공해야할 정보가 무엇인가를 근거로 판단해야 합니다.

 

궁금한 점이 있으면 아래 버튼을 클릭해 주십시오.

                                        

'야행하는 리서치' 카테고리의 다른 글

50. 회귀분석 ①  (0) 2018.08.06
49. AHP(Analytical Hierarchy Process)에 대한 이해  (1) 2018.07.06
47. 분산분석 ③  (0) 2018.05.07
46. 리서처가 바라본 빅 데이터  (0) 2018.03.15
45. 분산분석 ②  (0) 2018.03.15
Posted by dooka
,

세 가지 제품별 광고에서 정보 전달 중심의 광고 크리에이티브와 이미지 중심의 광고 크리에이티브에 따라 제품 광고에 대한 선호도가 달라지는지가 문제가 되는 경우를 생각해 보겠습니다. 이렇게 관심 있는 요인이 2개인 분산분석을 이원분산분석법(이원배치법; two-way ANOVA)이라고 합니다. 이원분산분석법에서 제품과 광고 크리에티브 유형이 모델 선호도에 미치는 영향을 알아보기 위해서는 3×2 경우의 서로 다른 제품과 서로 다른 지향의 광고 시안을 만들어 전체 표본에 대해 무작위로 3×2개의 광고 시안을 무작위로 노출하여 선호도를 평가합니다.

 

 

이원분산분석법에서는 두 요인의 교호작용(interaction)에 따라 종속변수의 반응이 달라지는지 살펴 볼 수 있습니다. 사례에서 교호작용이 없다면 두 광고 유형간의 제품별 광고 선호도에 차이가 있지만 제품 광고별 선호도 차이가 각 광고유형별로 동일하게 나타날 것입니다. 만약 정보 지향 광고에서 전문적 권위를 보유한 정보원(information source)을 좀 더 선호하는 경향이 있기 때문에 교호작용이 있다고 한다면 정보 지향 광고에서의 제품 광고 간 선호도 차이가 이미지 지향 광고에서의 제품 광고 간 선호도 차이보다 더 크게 나타나게 될 것입니다.

 

 

R에서 이원분산분석법을 적용한 결과는 아래와 같습니다. 사례에서 활용한 데이터에서는 광고 제품 간 호감도는 통계적으로 유의미한 차이를 보이지만 광고 크리에이티브 유형 및 광고 크리에이티브 유형와 광고 제품 상호간의 교호작용은 유의미하지 않은 것으로 나타났습니다.

 

 

제품 광고 사례에서 R을 이용해 응답자가 제품 사용 빈도가 높은 사용자(heavy user) 인지 아니면 그렇지 않은 사용자(light user) 인지에 따라 광고 선호도에 차이가 있는지를 알고 싶다면 위 R 명령어에서 교호작용 항을 삭제하고 실행하면 됩니다. 그런데 이 경우 분석절차는 반복이 없는 이분산분석법과 동일하지만 실제 설문조사를 진행하는 방법은 매우 다릅니다. 광고 유형별 광고 모델 선호도 차이를 알기 위해 광고 유형과 광고 제품의 조합만큼의 처리(treatment)를 생성해서 무작위로 표본에 노출했습니다. 그러나, 조사 대상 응답자가 heavy user인지 light user인지 여부는 조사설계자가 임의로 응답자에게 부여할 수 있는 속성이 아닙니다. 그러므로 응답자의 사용빈도 유형과 광고 제품의 조합만큼의 처리를 만들어낸다는 것 자체가 불가능합니다. 다만, 응답자를 구획화(blocking)해서 분류할 수 있을 뿐입니다. 이를 반복이 없는 이원분산분석과 구별하여 확률구획법(RBD; Randomized Block Design)이라고 합니다. 이원분산분석법이 통제집단 사후측정설계라면 RBD는 비동질적 통제집단 설계라고 할 수 있습니다.

 

 

사례에 해당하는 가상의 데이터를 활용해 분석한 결과 응답자 유형에 따른 에 따른 제품 컨셉트별 선호도의 차이는 없는 것으로 나타났습니다.

 

 

궁금한 점이 있으면 아래 버튼을 클릭해 주십시오.

                                                

 

 

 

 

 

 

 

 

 

'야행하는 리서치' 카테고리의 다른 글

49. AHP(Analytical Hierarchy Process)에 대한 이해  (1) 2018.07.06
48. null과 0의 구분  (0) 2018.05.07
46. 리서처가 바라본 빅 데이터  (0) 2018.03.15
45. 분산분석 ②  (0) 2018.03.15
44. 분산분석 ①  (0) 2018.01.03
Posted by dooka
,

 

 

'House of Bones' 카테고리의 다른 글

House of Bones episode6  (0) 2018.05.13
House of Bones episode5  (0) 2018.05.13
House of Bones Episode3  (0) 2018.05.06
House of Bones Episode2  (0) 2018.01.26
House of Bones Episode1  (0) 2018.01.15
Posted by dooka
,

 

 

 

'House of Bones' 카테고리의 다른 글

House of Bones episode6  (0) 2018.05.13
House of Bones episode5  (0) 2018.05.13
House of Bones Episode4  (0) 2018.05.06
House of Bones Episode2  (0) 2018.01.26
House of Bones Episode1  (0) 2018.01.15
Posted by dooka
,

구글 트렌드를 살펴보면 우리나라에서 '빅 데이터'의 검색량이 ‘설문조사’의 검색량을 상회하고 있습니다. 우리나라에서의 빅 데이터에 대한 관심을 짐작할 수 있습니다.

 

그런데, 미국의 구글 트렌드 결과는 이와는 약간 다릅니다. 여전히 'survey'의 검색량이 매우 높은 격차를 두고 ‘big data’의 검색량을 상회하고 있습니다.

무미건조하게 이야기한다면 빅 데이터란 기존의 도구로는 처리할 수 없는 대용량의 데이터라고 정의할 수 있습니다. 빅 데이터를 조금 다른 측면에서 바라본다면 표본추출이 필요 없을 정도로, 혹은 관심 있는 모집단 전체로부터 얻은 데이터와 동일하다고 봐도 무방할 정도로 큰 데이터라고 이해할 수도 있을 것 같습니다. 만약 우리가 모집단의 관심 있는 정보를 모두 알고 있다면 표본추출을 할 필요도 없고 가설을 세울 필요도 없습니다. 빅 데이터를 활용할 수 있다면 가설 혹은 이론이라고 할 만한 것을 정립할 필요가 없다는 뜻입니다.

그러나 모든 기업이 말 그대로의 빅 데이터에 접근할 수 있다고 생각하는 것은 다소 비현실적입니다. 또한. 우리가 관심 있는 모집단에 대한 데이터 전체를 가지고 있다고 해도 바로 그 사실을 알 수는 없습니다. 데이터를 요약해야만 데이터에 담긴 정보를 알 수 있습니다.

원하는 데이터를 가지고 있더라도 이를 통해 누가 우리가 집중해야할 고객인지 알기도 쉽지 않습니다. 데이터를 보기만 하면 즉각적으로 누가 우리의 고객인지 바로 알게 되는 것이 아니라 데이터 분석을 통해 고객을 찾아내는 것이 오히려 일반적일 수 있습니다. 시장에서는 생산자와 소비자가 분리되어 있으므로 생산자가 제공하는 물리적인 제품이나 서비스가 소비자의 어떤 편익을 충족하는지를 선험적으로 알기 어려운 경우도 많습니다.

변화의 시기에는 어쩌면 근본으로 돌아가는 것이 좋은 생존전략이 될 수도 있습니다. 새로운 기술에 대해 지속적인 관심과 함께 조심 역시 가져야겠습니다.

궁금한 점이 있으면 아래 버튼을 클릭해 주십시오. 데이터테일즈가 성실하게 답변 드리겠습니다.

                                                    

 

'야행하는 리서치' 카테고리의 다른 글

48. null과 0의 구분  (0) 2018.05.07
47. 분산분석 ③  (0) 2018.05.07
45. 분산분석 ②  (0) 2018.03.15
44. 분산분석 ①  (0) 2018.01.03
43. 독립표본의 검정과 쌍체 비교  (0) 2017.09.25
Posted by dooka
,