일반 CSV 데이터가 아닌 독자들이 실제로 해보고 싶었던 위키피디아의 주제 분류, 트위터의 감성 분류, 영화 추천, 사진의 범주 분류, MP3의 음악 장르 분류 등을 기계 학습을 활용하여 구현하며 각 기법을 평가한다. 또한, 빅 데이터 시대에 맞춰 대량의 데이터를 빠르게 처리하는 기계 학습 환경을 구축해본다. 파이썬과 파이썬 생태계의 핵심인 NumPy, SciPy, scikit-learn등 다양한 라이브러리를 활용하여 파이썬 언어를 좀 더 깊게 이해할 수 있다. 개정판은 초판과 달리, 간결하게 예제를 재정리했으며, 관련 설명도 보강했다. 초판에서 부족했던 라이브러리도 좀 더 풍부하게 소개한다.