파이썬으로 데이터 과학 완전 정복!
이 책에서는 데이터 과학 데이터 분석을 위한 가장 보편적인 프로그래밍 언어인 파이썬을 다룬다. 파이썬의 설치 방법과 기본적인 지식부터 차근차근 설명해나간다. 자료형, 변수, 예약어, 식별자, 리터럴 상수 등 파이썬의 기초부터 넘파이, 판다스, 사이파이, 사이킷런 등 자주 사용되는 라이브러리를 활용해 다양하면서도 심도 있는 데이터 분석을 진행한다. 이 책은 총 6개의 파트로 이루어져 있다. 파트 1, 2를 통해서는 데이터 과학을 위한 체계와 도구를 소개한다. 다음으로는 지도 학습과 비지도 학습을 다루어 통계 학습과 기계 학습의 공통 분야를 다룬다. 지도 학습은 파트 3의 회귀와 파트 4의 분류로, 비지도 학습은 파트 5의 그룹화와 파트 6의 차원 축소로 나뉜다. 종속 변수가 존재할 때 사용하는 데이터 분석 방법론인 지도 학습(분류, 회귀)과 종속 변수가 존재하지 않을 때 사용하는 분석 방법론인 그룹화, 차원 축소에 대한 학습을 통해 보다 정확하고 체계적인 통계분석 방법을 제시하고 있다. 두 저자는 독자의 이해를 돕기 위해 도표와 그림, 예제를 적극적으로 활용한다. 책으로 공부하면서 데이터 분석을 직접 실행해볼 수 있기에 더욱 효과적으로 학습할 수 있다. 데이터 분석 방법론을 활용 수단으로 사용하고 싶다면 이 책을 적극 활용하기 바란다.
한 권으로 배우는 통계 학습의 모든 것!
파이썬은 간결하면서도 생산성이 높아 활용도가 좋은 프로그래밍 언어다. 그 문법이 다른 프로그래밍 언어에 비해 쉽기 때문에 초보자도 마음만 먹는다면 쉽게 배울 수 있다는 장점이 있다. 현대사회와 데이터 과학은 이제 떼려야 뗄 수 없는 관계가 되었다. 이 책은 파이썬을 이용해 데이터 과학을 하나로 관통하는 프레임워크와 파이썬을 활용한 다양한 분석 사례를 제시한다. 데이터 과학은 주어진 데이터를 통해 필요한 정보를 찾고 가치를 만들어내는 것이다. 데이터를 수집하고 표현하는 주체와 대상에 따라 데이터 형태가 달라지기 때문에 데이터 분석을 하기 위해서는 정확한 방법을 아는 것이 중요하다. 이 책에서는 데이터의 유형(정형, 비정형)의 구분부터 데이터 과학을 위한 파이썬의 핵심 기능을 제시한다. 다양하고 현실적인 예제를 통해 사용자가 직접 데이터 과학 통계분석에 임할 수 있다는 장점이 있다. 아직 파이썬을 접해보지 못한 독자들에게 도움이 될 입문서라고 할 수 있다. 비전공자들도 데이터 과학의 체계를 쉽게 파악할 수 있도록 쓰였다. 파이썬을 활용한 데이터 분석 사례를 통해 파이썬을 실질적이고 체계적으로 배우고 싶다면, 이 책이 길라잡이가 되어줄 것이다.