[옮긴이의 말]
처음 이 책을 읽었을 때, 어쩐지 마음이 놓였습니다.
‘데이터 분석’이라 하면 왠지 ‘나와는 다른 차원의 사람들이 하는 일’처럼 느껴졌거든요(물론 실제로도 그렇긴 하지만요). 하지만 책을 통해 복잡한 모델과 어려운 코드로만 가득할 것 같은 세상에도 실수와 좌절이 있다는 걸 알고 나니, 데이터 분석도 사람이 하는 일이었다는 당연한 사실을 새삼 깨달았습니다.
저는 IT 분야 전공자가 아닙니다. 데이터 분석가는 더더욱 아니에요. IT 기업에서 기술과 시장 트렌드를 살피며 시장조사기관과 커뮤니케이션하는 일을 하고 있습니다. 새로운 기술이나 서비스가 왜 그리고 어떤 방식으로 만들어지고 쓰이는지를 이해하고, 그것을 다른 사람들이 읽기 쉽도록 풀어내는 일이 제 몫입니다. 어찌 보면 데이터를 읽고 해석하는 또 다른 방식의 분석 작업일지도 모르겠습니다.
그래서였을까요? 책을 옮기며 “나도 이런 일을 겪었는데…” 하는 대목들이 참 많았습니다. 보고서를 쓰며 애써 모은 자료가 엉뚱한 질문 하나에 무력해질 때, 잘되리라 믿었던 발표가 상대의 반응 한 줄에 꺾여버릴 때. 데이터 분석의 장면이 아니더라도 일하는 모든 이에게 낯설지 않은 순간들이 가득했습니다. 분석 대상도 사용하는 도구도 다르지만 프로젝트가 처음엔 다 잘될 것 같다가도 막상 해보면 어디선가 삐걱대는 경험, 누구나 한 번쯤은 겪었을 거예요.
결국 이 책은 데이터 분석을 ‘업’으로 삼는 사람이 어떻게 그 일을 잘 해나갈 수 있을지에 관한 이야기라고 생각합니다. 조직 생활을 하며 혼자 해내는 일이 얼마나 있겠냐마는, 데이터 분석이야말로 ‘협업’이 필수인 영역일 것입니다. 비즈니스 담당자와 데이터의 의미를 함께 해석하고, 경영진에게 분석 결과를 설득력 있게 전달하고, 때로는 다른 부서의 도메인 전문지식을 빌려야 하기도 하니까요. 나아가 이 책이 보여주고자 하는 자세, 그러니까 실패에 귀 기울이고, 실패를 분석하고, 실패를 기록하는 태도야말로 데이터 분석뿐 아니라 우리가 하는 모든 문제 해결의 출발점이 아닐까 합니다. 어찌 보면 이 책은 ‘데이터 분석’을 빌려 ‘일의 기본’을 말하는 책이라 할 수도 있겠습니다.
역자이자 IT 업계의 동료로서, 이 책이 데이터와 씨름하며 고군분투하는 모든 분에게 작게나마 단단한 조언으로 남을 수 있다면 좋겠습니다.
[감수자의 말]
20년이 좀 못 되는 기간동안 데이터 분석 분야에서 일을 하고 데이터 분야 책에 관해서도 다양하게 관여를 하다 보니, 데이터 분석 책에 대한 추천 문의 역시 많이 받았습니다. 그중 아무래도 데이터 분석 업무를 처음 시작하는 사람들이 읽기 좋은 책이나, 데이터 분석 업무를 하는데 꼭 읽었으면 좋겠다 하는 책을 추천해 달라는 경우가 많았습니다. 그럴 때마다 저는, 이 분야의 기술이 워낙 빠르게 발전하고 있다 보니 기술서의 경우 매번 달라질 수 있고 초심자용 책은 이미 좋은 책이 충분히 많아서 적당히 맞는 것을 취사선택할 수 있지 않나 싶은 생각이 들었습니다. 하지만 그럼에도 불구하고 무언가 늘 아쉬운 마음이 있었습니다.
연구 목적의 데이터 분석이 아니고 ‘데이터 과학자(및 데이터 분석가 등의 데이터를 분석하는 것이 주 업무인 모든 직업, 이하 데이터 과학자로 통칭함)’라는 직업을 가지고 데이터 분석을 마주하는 경우, 데이터 분석은 많은 경우 넓은 범위의 ‘문제 해결 과정’의 형태를 띱니다. 좋은 접근부터 좋은 마무리까지 가기 위해서는 기술적인 것보다도 더 넓은 범위에서 고려해야 할 것들이 다양하게 발생합니다. 이 문제를 해결하기 위한 이해 관계자들을 파악하고, 사람들과 어떻게 대화하고, 결과물을 어떻게 효과적으로 전달할 수 있는지까지, 흔히 생각하는 좁은 범위의 ‘데이터 분석’ 이상으로 신경 써야 할 것들이 산더미입니다. 그리고 이런 것들이, 결과적으로는 실제로 성과에 영향을 미치는 ‘좋은’ 데이터 분석을 만듭니다.
제가 그간 다양한 곳에서 데이터 분석을 해오면서, 한 번도 예외사항을 발견하지 못했고, 저는 데이터 분석이란 결국 일종의 ‘문제 해결’의 형태라고 생각해 오고 있습니다.
하지만 대다수의 데이터 분석 관련 책은 주로 데이터를 기술적으로 처리하고 알고리즘을 적용하는 부분에 집중하여 이야기합니다. 아무래도 ‘데이터 분석’ 이라는 단어나, ‘데이터 과학자’라는 직업을 생각했을 때 떠올리는 이미지는 주로 수학과 기술로 무언가를 해결하는 사람들에 대한 이미지고, 수학과 기술 지식을 가지고 있어야 실제로 이런 일을 할 수 있다 보니 책이나 교육 과정도 그럴 수밖에 없을 것입니다. 또한 넓은 범위의 일에 대한 지식이라는 것은 어떻게 보면 일마다 회사마다 다소 다를 것으로 느껴지기도 합니다. 수학이나 기술 같은 전문 지식이 아닌 부분은 ‘소프트 스킬’이라는 이름하에 모두가 공통적으로 이미 어느 정도 숙지하고 있는 교양으로 구분되기도 합니다.
하지만, 이 중에서도 분명히 데이터 분석 분야의 문제 해결을 위해서 필수적으로 필요한 부분이 분명히 있고, 이런 내용은 기술지식만큼 혹은 그 이상으로 중요합니다. 또한 오늘날처럼 갑자기 LLM을 비롯한 AI가 대두되고, 많은 문제 해결의 방법이 빠르게 변하는 상황에서는 기술 지식 그 자체만큼이나 기술 지식을 ‘어떻게 적용하느냐’가 중요한데 이에 대해서는 매번 ‘경우마다 다르다’라는 말로 뭉뚱그려져 왔고, 그때 그때 최신의 기술에만 현혹되다 보니 결국 문제 해결의 본질 주위를 겉도는 패턴이 예전부터 지금까지 반복되어 왔습니다.
경우마다 다르다는 것은 대부분의 경우 거부할 수 없는 사실이지만, 그래도 데이터 분석에 한정한다면 그에 공통적으로 적용되는 부분이 있기 마련입니다. 그리고 이런 부분은 충분히 공유하고 논의할 가치가 있습니다. 그래서 저 역시도 다양한 경로를 통해서 이런 내용을 알리고자 했지만, 다소 역부족이라는 생각을 늘 마음 한켠에 가지고 있었습니다.
그런 의미에서 처음에 이 책의 역자인 신정원 님이 이 책을 처음 공유해 주셨을 때 저는 신기하기도 하고 반갑기도 했습니다. 물론 저는 일본어를 잘 모르기 때문에 번역 앱으로 대략적인 내용만 확인해 보는 정도였지만, 기술의 발전과 거의 무관하게 데이터 과학자들에게 꼭 필요한 기술 내외적인 부분이 충분히 들어가 있는 것처럼 보였습니다. 이 책이 제가 부족하다고 느꼈던 부분을 많이 채워줄 수 있을 것이다 싶어서 우리말 번역이 되었으면 좋겠다고 적극 추천하게 되었습니다. 다만 책이 아주 최신은 아니고, 일본의 대기업 상황과 현재 국내 기업의 상황 중에서는 다른 부분도 있기 때문에, 그 부분이 보완되면 좀 더 좋겠다 싶어서 자처해서 기술 감수 및 국내 인터뷰도 진행해서 담고, ‘감수자 한마디’라는 형식으로 업데이트와 국내 현황에 대한 조언을 실었습니다. 원래의 좋은 내용에 누를 끼치지 않으면서도, 어떻게 하면 이런 내용을 사람들이 좀 더 잘 받아들이고 도움이 되도록 만들 수 있을까 즐겁게 고심할 수 있었습니다.
초벌 번역한 원고를 받아서 이 책을 제대로 처음 완독했을 때를 생각합니다. 이미 충분히 예상은 했지만 생각보다도 더 주옥 같은 내용들이 들어있어서 기뻤습니다. 감수하는 입장에 앞서서 한 명의 데이터 과학자이자 독자로서 많은 내용에 공감하고 조금은 이전의 나의 모습을 반성할 수 있었습니다. 저 역시도, 이런 책을 쓰고 싶었는지도 모릅니다만, 이렇게 다른 분의 책에 참여하는 형태로라도 이런 내용을 전할 수 있어서 기쁩니다. 다른 많은 데이터 과학자 분들 역시 이 책을 통해서 이 업무에 ‘실질적인’ 도움을 받을 수 있을 것이라고 믿어 의심치 않습니다.