장바구니 담기 close

장바구니에 상품을 담았습니다.

Python 2학년 스크래핑의 구조

Python 2학년 스크래핑의 구조

  • 모리요시나오
  • |
  • 성안당
  • |
  • 2021-11-17 출간
  • |
  • 192페이지
  • |
  • 190 X 250 mm
  • |
  • ISBN 9788931556896
판매가

17,000원

즉시할인가

15,300

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
15,300

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평




머신러닝(기계학습)이나 데이터를 분석하는 데 반드시 필요한 ‘데이터’는 인터넷상에 방대하게 퍼져 있지만 파이썬을 사용하면 효율적으로 수집할 수 있다. 이러한 방법을 ‘스크래핑’이라고 합니다.
파이썬을 대략적으로 알고 계신 분들이 간단한 샘플을 만들어 보며 대화 형식으로 스크래핑의 구조를 배울 수 있습니다.

■ 대상 독자
● 파이썬의 기본 문법을 알고 있는 분(『파이썬 1학년』을 다 읽으신 분)
● 데이터 수집이나 데이터 분석 초보자

■ 2학년 시리즈의 포인트 셋
● 포인트(1) 기초 지식을 알 수 있다
각 장의 첫 부분에 만화나 일러스트를 넣어서 각 장에서 배울 내용을 소개합니다. 그 이후는 일러스트를 섞어가며 기초 지식에 대해 설명합니다.

● 포인트(2) 프로그램의 구조를 배운다
필요한 문법을 최소한으로 선별하여 중간에 포기하지 않도록 주로 대화 형식을 통해 알기 쉽게 설명합니다.

● 포인트(3) 개발 체험을 할 수 있다
프로그래밍 언어(애플리케이션) 초보자들도 재미있게 배울 수 있도록 다양한 예제를 마련했습니다.

■ 이 책의 포인트
염소 박사님, 다솜 양과 함께 인터넷에서 파일을 다운로드하는 방법, HTML을 해석하는 방법, 여러 데이터를 읽고 쓰기, ‘API의 사용법’으로 불리는 데이터 수집, 편리한 라이브러리를 이용한 간단한 가시화 방법을 알아봅니다.


목차


들어가며
이 책의 예제 테스트 환경 며
이 책의 대상 독자와 2학년 시리즈에 대해
이 책을 보는 법
예제 파일과 회원 특전 PDF의 다운로드에 대해


제1장 파이썬으로 데이터를 다운로드

LESSON 01 스크래핑이 뭘까?
크롤링과 스크래핑
주의해야 할 점도 있다
robots.txt란?

LESSON 02 파이썬을 설치해 보자
윈도에 설치하는 방법
macOS에 설치하는 방법

LESSON 03 requests로 액세스해 보자
라이브러리 설치 방법
HTML 파일을 읽어 들이는 프로그램
IDLE을 시작하자
프로그램을 만들어 보자
텍스트 파일에 쓰기: open, close
텍스트 파일에 쓰기: with문


제2장 HTML을 해석해 보자

LESSON 04 HTML을 해석해 보자
Beautiful Soup 설치하기
Beautiful Soup로 해석하기
태그를 찾아 표시하기
모든 태그를 찾아 표시하기
id나 class로 검색 범위 좁히기

LESSON 05 최신 뉴스 기사 목록을 구해 보자
디벨로퍼 툴을 사용해 범위를 좁히자

LESSON 06 링크 목록을 파일로 출력해 보자
모든 링크 태그의 href 속성 표시하기
모든 링크 태그의 href 속성을 절대 URL로 표시하기
링크 목록 자동 작성 프로그램

LESSON 07 이미지를 한꺼번에 다운로드해 보자
이미지 파일을 읽어 들여 저장하기
다운로드용 폴더를 만들어 저장하기
모든 img 태그의 이미지 파일 URL을 표시한다
페이지 안 이미지를 한꺼번에 다운로드하는 프로그램


제3장 표 데이터를 읽고 쓰자

LESSON 08 pandas를 사용해 보자
pandas 설치하기
표 데이터란?
CSV 파일 읽어 들이기
열, 행 데이터 표시하기
열, 행 데이터 추가하기
열, 행 데이터 삭제하기

LESSON 09 다양한 데이터 가공
필요한 정보 추출하기
데이터 집계하기
데이터 정렬하기
행과 열 바꾸기
CSV 파일로 출력하기

LESSON 10 그래프로 표시해 보자
matplotlib 설치하기
그래프로 표시하기
다양한 종류의 그래프 표시하기
개별 데이터를 그래프로 표시하기
막대 그래프를 이미지 파일로 출력하기

LESSON 11 엑셀 파일을 읽고 써 보자
openpyxl 설치하기
엑셀 파일로 출력하기
엑셀 파일 읽어 들이기

제4장 오픈 데이터를 분석해 보자

LESSON 12 오픈 데이터란?
오픈 데이터는 보물섬

LESSON 13 우체국: 우편번호 데이터
CSV 파일 읽어 들이기
데이터 추출하기

LESSON 14 e-나라지표: 국정모니터링지표
CSV 파일 읽어 들이기
데이터를 그래프로 표시하기

LESSON 15 기상자료개방포털: 기상청 날씨 데이터 서비스
CSV 파일 읽어 들이기
데이터를 그래프로 표시하기

LESSON 16 공공데이터포털: 지방자치단체 데이터
CSV 파일(소방서) 읽어 들이기
folium 설치하기
소방서를 지도에 표시하기
CSV 파일(음식점) 읽어 들이기
가게를 지도에 표시하기

제5장 웹 API로 데이터를 수집하자

LESSON 17 웹 API란?
다른 컴퓨터의 기능 이용하기

LESSON 18 OpenWeatherMap이란?
OpenWeatherMap 사이트 이용 순서
OpenWeatherMap 이용하기

LESSON 19 현재 날씨를 조사하자
도시명을 지정해 날씨 알아보기
JSON이란?
JSON 데이터 형식
JSON 데이터를 읽어 들이는 방법
우편번호를 지정해 날씨 알아보기

LESSON 20 오늘부터 5일 동안(3시간 간격)의 날씨 알아보기
5일 동안의 날씨를 구해 보자
UTC(협정 세계시)를 KST(한국 표준시)로 변환
5일 동안의 기온을 그래프로 표시해 보자
한 걸음 더

찾아보기

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 : 070-4821-5101
교환/반품주소
  • 부산광역시 부산진구 중앙대로 856 303호 / (주)스터디채널 / 전화 : 070-4821-5101
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.