장바구니 담기 close

장바구니에 상품을 담았습니다.

파이썬 데이터 클리닝 쿡북

파이썬 데이터 클리닝 쿡북

  • 마이클워커
  • |
  • 위키북스
  • |
  • 2021-11-19 출간
  • |
  • 388페이지
  • |
  • 188 X 240 X 17 mm
  • |
  • ISBN 9791158392789
판매가

28,000원

즉시할인가

25,200

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
25,200

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

목차


▣ 01장: 표 데이터를 판다스로 가져올 때의 데이터 정제
___1.1 CSV 파일 가져오기
___1.2 엑셀 파일 가져오기
___1.3 SQL 데이터베이스의 데이터를 가져오기
___1.4 SPSS, Stata, SAS 데이터 가져오기
___1.5 R 데이터 가져오기
___1.6 표 데이터 저장

▣ 02장: HTML과 JSON을 판다스로 가져올 때의 데이터 정제
___2.1 단순한 JSON 데이터 가져오기
___2.2 API를 통해 복잡한 JSON 데이터 가져오기
___2.3 웹페이지의 데이터 가져오기
___2.4 JSON 데이터 저장

▣ 03장: 데이터 측정
___3.1 처음 데이터를 훑어보기
___3.2 열을 선택하고 정돈하기
___3.3 행을 선택하기
___3.4 범주형변수의 빈도를 생성하기
___3.5 연속변수의 요약통계 생성하기

▣ 04장: 데이터의 부분집합에서 누락값과 이상값 식별
___4.1 누락값 찾기
___4.2 변수가 1개인 이상값 식별하기
___4.3 이변량 관계의 이상값과 예상치 못한 값 식별하기
___4.4 부분집합을 이용해 변수 간의 논리적 불일치를 찾기
___4.5 선형 회귀를 활용해 유의한 영향을
___4.6 k-최근접 이웃을 활용해 이상값을 찾기
___4.7 아이솔레이션 포레스트를 활용한 이상 탐지

▣ 05장: 시각화를 활용해 예상치 못한 값을 식별하기
___5.1 히스토그램을 활용해 연속변수의 분포를 조사하기
___5.2 박스플롯을 활용해 연속변수의 이상값을 식별하기
___5.3 그룹별 박스플롯으로 특정 그룹에서 예상치 못한 값을 드러내기
___5.4 바이올린 플롯으로 분포 형태와 이상값을 조사하기
___5.5 산점도를 활용해 이변량 관계를 보기
___5.6 라인 플롯으로 연속변수의 추세를 조사하기
___5.7 상관행렬을 기반으로 히트맵을 작성하기

▣ 06장: 데이터 정제, 탐색 및 시리즈 연산
___6.1 판다스 시리즈에서 값을 얻기
___6.2 판다스 시리즈에 대한 요약통계 표시
___6.3 시리즈 값 변경
___6.4 조건에 따라 시리즈 값을 변경
___6.5 문자열 시리즈 데이터 평가와 정제
___6.6 날짜 다루기
___6.7 누락 데이터 식별과 정제
___6.8 k-최근접 이웃으로 누락값 대치

▣ 07장: 집계 시 지저분한 데이터 다루기
___7.1 itertuples을 활용한 데이터 순회(안티 패턴)
___7.2 넘파이 배열의 그룹별 요약을 계산
___7.3 groupby를 사용해 데이터를 그룹별로 조직화하기
___7.4 좀 더 복잡한 집계 함수를 groupby와 함께 사용하기
___7.5 사용자 정의 함수 및 apply와 groupby
___7.6 groupby를 사용해 데이터프레임의 분석 단위를 바꾸기

▣ 08장: 데이터프레임들을 결합할 때의 데이터 문제 해결
___8.1 데이터프레임을 수직으로 결합하기
___8.2 일대일 병합
___8.3 병합 기준 열을 여러 개 사용하기
___8.4 일대다 병합
___8.5 다대다 병합
___8.6 병합 루틴 개발

▣ 09장: 데이터 타이딩과 리셰이핑
___9.1 중복 행 제거하기
___9.2 다대다 관계 수정하기
___9.3 stack과 melt로 넓은 데이터를 긴 포맷으로 리셰이핑
___9.4 열 그룹을 녹이기
___9.5 unstack과 pivot을

▣ 10장: 사용자 정의 함수와 클래스로 데이터 정제를 자동화
___10.1 데이터를 처음 살펴보는 함수
___10.2 요약통계와 빈도를 표시하는 함수
___10.3 이상치와 예상치 못한 값을 식별하는 함수
___10.4 데이터 집계와 결합을 위한 함수
___10.5 시리즈 값을 업데이트하는 로직을 담은 클래스
___10.6 표 형태가 아닌 데이터 구조를 다루는 클래스

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 : 070-4821-5101
교환/반품주소
  • 부산광역시 부산진구 중앙대로 856 303호 / (주)스터디채널 / 전화 : 070-4821-5101
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.