실제 데이터 분석가들이 다루는 프로젝트로 실전 능력을 키워보자!
“수많은 리뷰 데이터에서 가치 있는 정보를 얻으려면 어떤 분석 기법을 써야 할까요?”
우리가 데이터 분석 기초를 학습했다면 저마다 배운 개념을 토대로 다양한 텍스트 분석 기법을 제시할 것이다. 더 나아가 그 기법이 무엇인지, 어떻게 사용하는지 이론을 설명하는 건 어렵지 않을 것이다. 그럼 다음과 같은 요청을 받는다면 어떨까?
“광고 캠페인을 실행할 준비를 하고 있습니다. 더 많은 구매를 유도할 수 있도록 채널별 조회 수와 클릭 수를 비교하고 더욱 효과적인 채널을 선택해 주세요.”
이런 요청을 받는다면 어떨까? 어떤 클릭이 의미 있는 클릭이고 어떤 클릭이 순전히 무작위로 발생한 클릭일지 분석해 볼 계획을 바로 머리에 떠올릴 수 있을까? 다양한 분석 툴, 데이터 분석 과정(수집, 전처리, 분석, 시각화, 예측) 등 데이터 분석에 관한 이론은 어느 정도 능숙해졌지만, 막상 이런 실전 앞에서는 머리가 하얘질 수도 있다.
하나의 케이스를 두고 데이터를 분석하는 프로젝트는 코드와 알고리즘, 데이터셋, 시각화까지 조화롭게 다룰 줄 알아야 하고, 익숙해지는 데까지는 수많은 연습이 필요하다. 이 책은 실제 데이터 분석가들이 매일 다루는 문제 중에서 5가지 케이스를 가져와 문제 파악부터 솔루션까지 전 과정을 설명한다. 복잡한 데이터나 지저분한 데이터를 정제하는 법, 예측 모델에 맞지 않는 알고리즘을 해결하는 방법 등 프로젝트를 진행하면서 마주할 수 있는 어려운 상황에서 어떻게 해결해야 할지 실용적인 솔루션까지 알려준다. 지금까지 습득한 이론을 바탕으로 실질적인 데이터 분석 프로젝트를 경험해 보고 싶다면 이 책으로 넘어가 보자!