구글 트렌드를 살펴보면 우리나라에서 '빅 데이터'의 검색량이 ‘설문조사’의 검색량을 상회하고 있습니다. 우리나라에서의 빅 데이터에 대한 관심을 짐작할 수 있습니다.
그런데, 미국의 구글 트렌드 결과는 이와는 약간 다릅니다. 여전히 'survey'의 검색량이 매우 높은 격차를 두고 ‘big data’의 검색량을 상회하고 있습니다.
무미건조하게 이야기한다면 빅 데이터란 기존의 도구로는 처리할 수 없는 대용량의 데이터라고 정의할 수 있습니다. 빅 데이터를 조금 다른 측면에서 바라본다면 표본추출이 필요 없을 정도로, 혹은 관심 있는 모집단 전체로부터 얻은 데이터와 동일하다고 봐도 무방할 정도로 큰 데이터라고 이해할 수도 있을 것 같습니다. 만약 우리가 모집단의 관심 있는 정보를 모두 알고 있다면 표본추출을 할 필요도 없고 가설을 세울 필요도 없습니다. 빅 데이터를 활용할 수 있다면 가설 혹은 이론이라고 할 만한 것을 정립할 필요가 없다는 뜻입니다.
그러나 모든 기업이 말 그대로의 빅 데이터에 접근할 수 있다고 생각하는 것은 다소 비현실적입니다. 또한. 우리가 관심 있는 모집단에 대한 데이터 전체를 가지고 있다고 해도 바로 그 사실을 알 수는 없습니다. 데이터를 요약해야만 데이터에 담긴 정보를 알 수 있습니다.
원하는 데이터를 가지고 있더라도 이를 통해 누가 우리가 집중해야할 고객인지 알기도 쉽지 않습니다. 데이터를 보기만 하면 즉각적으로 누가 우리의 고객인지 바로 알게 되는 것이 아니라 데이터 분석을 통해 고객을 찾아내는 것이 오히려 일반적일 수 있습니다. 시장에서는 생산자와 소비자가 분리되어 있으므로 생산자가 제공하는 물리적인 제품이나 서비스가 소비자의 어떤 편익을 충족하는지를 선험적으로 알기 어려운 경우도 많습니다.
변화의 시기에는 어쩌면 근본으로 돌아가는 것이 좋은 생존전략이 될 수도 있습니다. 새로운 기술에 대해 지속적인 관심과 함께 조심 역시 가져야겠습니다.
궁금한 점이 있으면 아래 버튼을 클릭해 주십시오. 데이터테일즈가 성실하게 답변 드리겠습니다.
'야행하는 리서치' 카테고리의 다른 글
48. null과 0의 구분 (0) | 2018.05.07 |
---|---|
47. 분산분석 ③ (0) | 2018.05.07 |
45. 분산분석 ② (0) | 2018.03.15 |
44. 분산분석 ① (0) | 2018.01.03 |
43. 독립표본의 검정과 쌍체 비교 (0) | 2017.09.25 |