장바구니 담기 close

장바구니에 상품을 담았습니다.

파이썬을 이용한 통계적 머신러닝

파이썬을 이용한 통계적 머신러닝

  • 박유성
  • |
  • 자유아카데미
  • |
  • 2020-02-20 출간
  • |
  • 384페이지
  • |
  • 188 X 258 X 22 mm /746g
  • |
  • ISBN 9791158082536
판매가

29,000원

즉시할인가

28,710

배송비

2,500원

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
28,710

이 상품은 품절된 상품입니다

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평




이 책을 통한 여행을 시작하기 전에 독자들은 스스로를 평가해야 한다. 기준은 간단하다. 통계적 · 수학적 지식이 있는지를 알아보는 것이다. 측정은 제2장 을 통해서 스스로 하면 된다. 최적화에 대한 수식의 전개를 이해할 수 있다면 통계적 · 수학적 지식이 있다고 생각하면 된다. 이렇게 통계적 · 수학적 지식이 있는 사람을 통지자라는 약자로 지칭하겠다. 이제 통지자와 비통지자에 맞춰 각 장의 내용을 소개하겠다.

제1장은 머신러닝을 전반적으로 정의하고 머신러닝 분류, 분석 절차, 모형 등을 다룬다.
제2장은 사전과정과 최적화에 대해 나오는데, 통지자 여부와 관계없이 제공된 프로그램을 하나씩 실행하면서 모두 이해해야 한다. 특히 최적화는 비통지자도 두세 번 읽어보면 이해할 수 있으니 어려워 말고 꼭 숙지하고 넘어가도록 한다. 제2장은 통계적 머신러닝뿐만 아니라 딥러닝에도 동일하게 요구되는 사항이며 최적화는 통계적 머신러닝과 딥러닝의 엔진에 해당하므로 작동원리를 이해해야 한다.
제3장은 KNN을 다루는데, 통지자든 아니든 관계없이 쉽게 이해할 수 있을 것이다. 그러나 몇 개의 수식이 이해되지 않으면 그냥 넘어가도 전체를 이해하는 데 문제가 없을 것이다.

제4장은 로지스틱 회귀를 소개한다. 딥러닝에서도 빈번하게 사용되므로 어떤 논리로 분류에 사용되는지 이해하면 된다. 통지자는 수식을 따라가면서 이해하면 되지만 비통지자는 로지스틱 함수가 왜 등장하는지, 어떻게 적용되어 분류를 하는지만 이해해도 된다. 규제화에 대한 설명이 나오는데 비통지자는 제공된 그림만 이해하면 된다.
제5장은 판별분석과 단순베이즈모형을 공부한다. 처음부터 수식이 나와서 비통지자는 좀 당혹스러울 수도 있다. 그러나 그냥 정의라고생각하고 넘어가되, 제공된 두 개의 그림으로 그 원리를 이해하면 될 것이다.
제6장은 회귀나무와 분류나무를 다룬다. 이해하는 데 큰 어려움이 없겠지만, 의사결정나무는 원리가 간단하더라도 Kaggle에서 여러 번 우승을 한 앙상블러닝의 핵심이 되므로 원리를 꼼꼼하게 이해하길 바란다.

제7장은 써포트벡터머신을 소개하며 수식이 가장 많은 장 중 하나이다. 비통지자는 그림을 중심으로 이해하고 수식은 넘어가도 된다. 통지자인 경우, 수식을 따라가면 써포트벡터머신의 원리를 이해할 수 있을 것이다.
제8장은 차원축소를 다루는데, 비통지자가 가장 괴로운 장이 될 것이다. 그림을 통해 이해하되 수식은 그냥 이상한 부호라고 생각하면서 일독하고 무엇을 하려고 하는지 감만 잡으면 되며 제공된 프로그램으로 이해하면 된다. 통지자에게 쉬운 말로 설명해 달라고 하면 금방 이해할 수 있을 것이다. 가까이 아는 통지자가 없으면 저자에게 이메일로 문의하면 쉽게 설명해 줄 수 있다. 제8장의 차원축소는 2차 분석에 매우 유용하고 딥러닝에서도 개념적으로 유용하므로 차원축소의 의미를 이해하도록 하자.
제9장은 통계적 머신러닝과 딥러닝의 핵심에 해당하는 부분이다. 전통적인 통계학과의 차이점인 일반화에 대한 논의를 하고 있다. 직관적이므로 이해하는 데 큰 어려움이 없을 것이다. 프로그램을 통해 교차검증, 일반화, 과대적합의 의미를 완벽하게 이해하도록 하자.

제10장은 회귀분석에 대한 내용이다. 회귀분석에 대한 기본개념을 가지고 있으면 이해할 수 있을 것이다. 비통지자의 경우, 써포트벡터머신은 수식을 따라가지 말고 관련된 그림으로 이해하는 것이 좋다.
제11장은 앙상블학습이 나오는데, 통계적 머신러닝의 꽃이라고 할 수 있다. 그러나 비통지자가 따라가기에는 수식이 너무 많고 통지자들에게도 쉽지 않을 것이다. 비통지자는 수식을 따라가지 말고 글로 설명된 부분과 그림으로 개념을 이해하도록 하자. 그리고 GBM과 XGBoost의 원리는 제2장의 최적화와 연계되어 있지만 이해하기 쉽지 않으니 GBM과 XGBoost를 실행하는 프로그램을 익히고 해석에 집중하는 것이 더 좋다.
제12장은 비지도학습으로 수식을 따라가지 않더라도 이해할 수 있도록 구성하였다. 개념과 원리만 이해하고 프로그램을 통해 구현하다 보면 익숙해질 수 있을 것이다.
제13장은 비정형데이터의 수량화 과정을 보여 주고 있다. 이러한 수량화 과정은 딥러닝을 이해하고 적용하는 데 필수적이다. 그러므로 제13장은 딥러닝의 마중물로 이해하면 될 것이다. 이 책은 장마다 파이썬 프로그램이 제공되어 있다. 통지자 여부와 관계없이 하나씩 실행해 보아야 한다. 특히 비통지자는 제공된 프로그램을 실행해 공부함으로써 부족한 통계적 · 수학적 이해를 보완할 수 있을 것이다. 부록에는 파이썬의 사용법과 이를 실행할 수 있는 anaconda 설치법이 나와 있다. 독자 본인의 컴퓨터에 설치하여 제공된 프로그램을 돌려보면서 하루에 3시간씩 2 ~ 4일만 투자하면 머신러닝을 배우는 데 필요한 파이썬을 익힐 수 있을 것이다.

좋은 책을 위해 최선을 다했지만 부족한 부분이 있을 수 있다. 이 점은 양해를 바라며, 책에 나오는 파이썬 실습 프로그램과 출간 후 나올 수 있는 수정사항 등은 자유아카데미 홈페이지(www.freeaca.com) 자료실을 통해 제공할 예정이니 참조하기를 바란다.


목차


1장 머신러닝
1.1 머신러닝의 분류
1.2 머신러닝의 분석 절차
1.3 머신러닝 모형
1.4 Data scientist가 되기 위해 필요한 지식

2장 사전과정과 최적화
2.1 실수자료로의 전환
2.2 자료의 특성
2.3 사례분석
2.4 불균형자료의 처리
2.5 손실함수와 최적화

3장 K-Nearlest Neighbors
3.1 KNN의 적용
3.2 커널분포함수 추정

4장 로지스틱 회귀 분류
4.1 적응선형뉴런
4.2 로지스틱 회귀
4.3 과대적합에 대한 규제화
4.4 Scikit을 이용한 로지스틱 회귀

5장 판별분석과 단순베이즈모형
5.1 판별분석
5.2 단순베이즈모형
5.3 Scikit learn을 이용한 LDA와 단순베이즈모형

6장 분류와 회귀나무
5.1 회귀나무
5.2 분류나무
5.3 Scikit learn을 이용한 의사결정나무

7장 써포트벡터머신
7.1 선형 써포트벡터머신
7.2 커널 SVM
7.3 Sklearn을 이용한 SVM

8장 차원축소
8.1 특잇값 분해
8.2 확률화 PCA
8.3 커널 PCA
8.4 선형판별분석을 통한 차원축소
8.5 시각화를 위한 차원축소
8.6 SKlearn을 이용한 차원축소

9장 모형진단과 교차검증
9.1 k-분할 교차검증
9.2 중첩 교차검증
9.3 Scikit learn의 적용

10장 회귀분석
10.1 선형회귀모형
10.2 로버스트 회귀
10.3 SVM 회귀와 커널 SVM 회귀
10.4 규제화된 선형회귀모형
10.5 Scikit learn을 이용한 회귀분석

11장 앙상블학습
11.1 Bagging, Pasting, 그리고 Random forest
11.2 앙상블학습을 위한 통계적 머신러닝의 특성
11.3 아다부스트
11.4 기울기부스팅
11.5 XGBoost
11.6 LightGBM
11.7 적용 사례

12장 군집
12.1 K-means 군집
12.2 계층적 군집
12.3 DBSCAN과 HDBSCAN
12.4 Scikit learn을 이용한 군집

13장 감성분석
13.1 감성분석
13.2 파이썬을 이용한 사례 분석

부록 파이썬의 이해
1. 파이썬 구문
2. 변수와 자료형태
3. 파이썬의 연산
4. 조건문과 반복문
5. 객체지향성 프로그램
6. 파이썬 자료의 저장, 읽기 그리고 추가
7. 넘파이
8. 판다스
9. 그림그리기

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 : 070-4821-5101
교환/반품주소
  • 부산광역시 부산진구 중앙대로 856 303호 / (주)스터디채널 / 전화 : 070-4821-5101
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.