R을 이용해 IPA(Importance Performance Analysis)의 결과를 산점도(scatter diagram)로 만들어 보겠습니다.

아래와 같은 가상의 데이터를 가지고 작업을 시작해 보겠습니다. q1_1은 세부항목별 만족도 중 친절성을, q1_2, q1_3, q1_4, q1_5는 각각 전문성, 청결성, 다양성, 품질을 나타내고 q2는 전반적 만족도라고 해보겠습니다.

 

산점도를 작성하기 위해 q2q1_1, q1_2, q1_3, q1_4, q1-5Pearson상관계수를 구하고 각각의 상관계수를 표준화합니다.

 

 

R을 이용해 산점도를 작성하기 위해 필요한 패키지를 설치합니다.

산점도를 그리고자 하는 파일을 CSV형태로 저장하고 read.csv명령을 이용해 dataframe 형태도 불려 옵니다.

마지막으로 산점도를 작성합니다. 산점도의 점 모양은 원형으로 지정했고(shape=19), 산점도 값들의 라벨은 f변수로 설정했습니다. 이때 label=“f”로 지정하면 f를 문자로 인식해 라벨이 f로 일괄 지정되므로 쌍따옴표 없이 label=data$f로 지정해 줍니다. ‘데이터명$변수명의 형식으로 변수를 지정해 주는 이유는 R에서는 변수가 기본적으로 벡터이기 때문입니다. dataframe을 지정해주지 않으면 독립적인 벡터로 인식하여 오류가 발생합니다. 이를 피하기 위해 dataframe을 등록해주는 방법이 있지만, 복잡한 분석이 아니라면 구태여 dataframe을 등록하지 않아도 크게 불편하지 않은 것 같습니다.

궁금하신 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변드리겠습니다!

 

 

'R기어가기' 카테고리의 다른 글

6. R로 차트 만들기 ①  (0) 2017.08.05
5. 테이블!! R로 다시 만들기  (0) 2017.07.13
3. 테이블! R로 만들기  (0) 2017.01.07
2.R을 이용한 word cloud 만들기  (1) 2016.08.12
1.R! 파일을 열다  (0) 2016.07.02
Posted by dooka
,

경영지도사 2차 마케팅 부문을 준비하시는 분이라면 2016년 시장조사론 2차 시험에서 표본조사론 중 층화추출법의 종류를 묻는 문제가 출제된 것을 알고 계실 듯합니다. 표본추출에 대해 이해하는 것은 통계적 사고를 하는데 중요한 출발점이 되므로 앞으로 표본추출과정을 알아보는 시간을 갖고자 합니다.

표본추출은 다음과 같은 과정을 거쳐 진행하게 됩니다.




표본추출은 표본추출의 대상이 되는 모집단을 정의하는데에서 출발합니다. 모집단은 막연하게 추상적으로 정의할 것이 아니라 명확하게 조작적으로 정의해야 합니다. 우리가 머리 속에서 그리는 모집단의 관념과 표본추출을 위해 정의한 모집단 간의 괴리가 거치면 표본추출 과정 전체가 무의미해지므로 심사숙고해야 할 부분입니다. 현실적으로는 반복적 경험을 통해 모집단 정의를 보완해야 합니다.

다음으로 표본추출단위를 무엇으로 할 것인지 정하고 표본추출을 위한 프레임 즉 명단을 확보해야 합니다. 표본추출방법에는 확률표본추출과 비확률표본추출의 두 가지 방법이 있습니다. 선거조사와 같은 공공부문에서는 확률표본추출을 적용하지만 마케팅 분야의 시장조사에서는 확률표본추출보다는 비확률표본추출이 오히려 일반적입니다. 그럼에도 불구하고 고객의 요구에 따라 확률표본추출을 전제로 하는 통계분석을 적용하기도 합니다.

표본추출방법을 정하고 나면 표본크기를 결정하게 되는데 조사목적과 자료수집방법, 조사기간 및 비용을 고려하고 확률표본추출인 경우 허용오차한계를 고려해 표본크기를 정하게 됩니다. 실무적에서 조사의 품질을 위해서는 조사목적 즉 조사를 통해 알아야할 내용을 고려하는 것이 특히 중요합니다.

본격적으로 표본추출에 대해 다루기 전에 알아두어야 할 기본적인 개념은 아래와 같습니다.


궁금하신 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변 드리겠습니다!





Posted by dooka
,

디지털 사이니지(Digital Signage)는 공공장소나 상업공간에 네트워크를 통한 원격제어가 가능한 디지털 디스플레이를 설치하여 광고와 정보, 엔터테인먼트 등 다양한 콘텐츠를 제공하는 매체입니다. 20대에서 40대 사이의 성인 남녀 94명에게 디지털 사이니지를 어디에 설치하면 좋을지 물어보았습니다.

서베이몽키가 제공하는 텍스트분석을 이용한 분석결과는 아래와 같습니다. 버스정류장과 지하철을 가장 많이 응답해 상식적인 추론과 다르지 않은 결과입니다.

 

서베이몽키가 교착어인 우리글을 분석하는 데에는 약간의 한계가 있다고 생각해서 R이 제공하는 wordcloud 분석을 실시해 보았습니다. 버스정류장이나 지하철 외에도 화장실, 박물관, 병원, 은행 등 다양한 범위와 종류의 장소를 디지털 사이니지의 설치장소로 언급하고 있음을 알 수 있습니다.

궁금한 점이 있으면 아래 버튼을 클릭해 주세요. 성실하게 답변드리겠습니다!  

Posted by dooka
,