목차
■ 머리말
1. 파이썬(Python)으로 시작하는 데이터 분석
1.1 파이썬으로 데이터 분석을 해야 하는 이유
1.2 파이썬 개발 도구(주피터노트북) 설치
1.3 주피터 노트북 실행 및 사용 방법
2. 넘파이(Numpy)
2.1 Numpy 기초
2.1.1 Numpy와 List의 비교
2.1.2 Numpy 속성
2.1.3 Numpy.arange() 함수
2.1.4 Numpy 통계 관련 함수
2.2 Numpy 인덱싱(indexing), 슬라이싱(slicing), 반복(iterating)
2.2.1 Numpy 인덱싱과 슬라이싱
2.2.2 논리적 인덱싱
2.2.3 2차원 배열에서의 인덱싱과 슬라이싱
2.3 결합(concatenate)과 분리(split)
2.3.1 배열의 결합과 전치(np.concatenate()와 np.transpose())
2.3.2 배열 분리
2.4 Numpy의 특별한 행렬과 벡터
2.4.1 np.zeros() 와 np.ones()
2.4.2 np.full() 와 np.eye()
2.4.3 np.random()
3. 판다스(pandas) - 시리즈(Series)
3.1 시리즈 생성과 정렬
3.1.1 시리즈 생성
3.1.2 시리즈 인덱싱, 슬라이싱
3.1.3 시리즈 values 변경, 추가
3.1.4 시리즈 index와 values
3.1.5 시리즈 index 재설정
3.1.6 시리즈 정렬
3.2 시리즈 주요 메서드
3.2.1 head()와 tail()
3.2.2 unique(), nunique() 그리고 value_counts()
4. 판다스(pandas) - 데이터프레임(DataFrame)
4.1 데이터프레임 생성과 정렬
4.1.1 데이터프레임 생성과 이름 변경
4.1.2 데이터프레임 행과 열
4.1.3 데이터프레임 인덱싱과 슬라이싱
4.1.4 데이터프레임 복사
4.1.5 데이터프레임 행 / 열 선택 및 추가
4.1.6 데이터프레임 연산
4.1.7 데이터프레임 행 / 열 삭제
4.1.8 데이터프레임 논리적 인덱싱
4.1.9 데이터프레임 정렬
4.2 데이터프레임 데이터 타입(자료형)
4.2.1 Category 타입
4.2.2 datatime 타입
5. 판다스(pandas) - 데이터프레임(DataFrame) 다루기
5.1 CSV 파일로 데이터프레임 생성
5.2 5.2 데이터 요약
5.3 결측치 제거 및 대체
5.3.1 결측 데이터 확인과 NaN의 의미
5.3.2 결측 데이터 삭제
5.3.3 결측치에 값 채우기
5.3.4 결측치 단일 대체
5.3.5 결측치 다중 대체(마스킹과 보간)
5.4 문자열 데이터 처리
5.4.1 파이썬의 기본 문자열 처리 함수
5.4.2 str 액세서와 문자열 처리 메서드
5.4.3 정규 표현식
5.4.4 str.contains()과 str.startswith(), str.endswith()
5.4.5 apply(), agg(), map(), applymap() 비교
5.5 데이터프레임 결합과 병합
5.5.1 pandas.concat()
5.5.2 pandas.merge()
5.6 그룹 집계와 멀티인덱스
5.6.1 groupby()
5.6.2 멀티인덱스와 swaplevel(), droplevel()
5.6.3 groupby()에 멀티인덱스 적용
5.6.4 pandas.transform()
5.6.5 unstack()과 stack()
5.6.6 cross_tab()
5.6.7 pivot()과 pivots_table()
6. 데이터 시각화
6.1 pandas의 plot()
6.1.1 line 그래프
6.1.2 box 그래프
6.1.3 bar 그래프
6.1.4 pie 그래프
6.1.5 hist 그래프
6.1.6 kde 그래프와 scatter 그래프
6.2 matplotlib 라이브러리
6.2.1 matplotlib으로 기본 그래프 생성
6.2.2 Figure 생성과 subplot 추가
6.2.3 box 그래프와 bar 그래프
6.2.4 pie 그래프
6.2.5 hist 그래프
6.2.6 scatter 그래프
6.3 Seabron 라이브러리
6.3.1 seabron 예제 데이터 세트 활용
6.3.2 countplot()과 barplot()
6.3.3 histplot()과 boxplot(), violinplot()
6.3.4 scatterplot()과 relplot()