장바구니 담기 close

장바구니에 상품을 담았습니다.

헬로 데이터 과학 (컴퓨터/IT)

헬로 데이터 과학 (컴퓨터/IT) MS 본사 데이터 과학자가 알려주는

  • 김진영
  • |
  • 한빛미디어
  • |
  • 2016-03-01 출간
  • |
  • 352페이지
  • |
  • 153 X 223 mm
  • |
  • ISBN 9788968482656
★★★★★ 평점(10/10) | 리뷰(1)
판매가

18,000원

즉시할인가

16,200

배송비

2,300원

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
16,200

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

목차

1장 데이터 과학 입문
삶과 비즈니스를 바꾸는 데이터의 가능성
__의학을 보완하는 개인 데이터의 힘 : 마크 드랭숄트
__스타트업의 성장 신화를 뒷받침하는 데이터의 힘 : 에어비앤비
__이들은 데이터를 어떻게 활용했나
데이터 과학과 테이블
__데이터는 테이블이다
__데이터 과학은 테이블 놀이다
데이터 과학에 대한 오해와 진실
__스몰데이터로 시작하라
__단순한 도구와 기술로 시작하라
데이터 과학을 시작하는 방법
__데이터 마인드를 가져라
__데이터 습관을 길러라
__관련 지식과 기술을 익혀라
맺음말

2장 데이터 과학에 유용한 도구
데이터 과학을 위한 도구 선택하기
__처리 용량 및 속도
__지원 데이터형 및 프로그래밍 환경
__데이터 분석 및 시각화 기능
__문제 특성에 맞는 도구의 선택
__문제 해결 단계에 맞는 도구 선택
엑셀로 시작하는 데이터 과학
__코드가 아닌 데이터가 중심이다
__올인원 솔루션이다
__결과물을 쉽게 공유할 수 있다
언제부터 엑셀 대신 R을 사용해야 할까
__워크시트에서 변수로
__메뉴에서 함수로
__분석에서 예측으로
[실습] 엑셀의 기초
__데이터 불러오기
__데이터 준비하기
__데이터 분석 및 시각화하기
__데이터 집계하기
[실습] R 맛보기
__R 작업을 위한 환경 구축
__R의 기본 기능
__데이터 준비하기
__데이터 분석하기
맺음말

3장 문제 정의와 데이터 수집 및 준비
데이터 문제 정의하기
__데이터 문제 해결 단계
__데이터 분석 단계
[사례] 직원 만족도 개선을 위한 데이터 분석
__데이터 문제 정의하기
[사례] 넷플릭스 프라이즈 문제 정의
__유의사항
데이터 수집하기
__데이터 수집의 기본
__수집 방법 결정하기
[심화학습] 측정 기술
__어떤 대상도 측정할 수 있는가
__어떤 대상도 측정할 수 있는 방법
__수집 환경 결정하기
[심화학습] 실험 디자인
__무작위 디자인
__블록 디자인
__수집할 데이터양 결정하기
__데이터 품질 점검하기
__유의사항
__데이터 준비하기
__데이터 선택, 추가, 집계하기
[실습] 엑셀을 이용한 데이터 준비
맺음말

4장 데이터 분석과 스토리텔링
현상 이해하기 : 탐색적 데이터 분석
__탐색적 분석 단계
[사례] 엑셀로 해보는 탐색적 데이터 분석
__개별 속성 분석하기
__속성 간의 관계 분석하기
__유의사항 : 관점은 갖되 편견은 금물이다
현상 일반화하기 : 통계적 추론
__통계적 추론의 원리
__통계적 추론의 유형
[실습] 엑셀로 해보는 통계적 추론
__탐색적 데이터 분석
__데이터 가공하기
__통계적 추론
__유의사항 : 데이터에서 도출하는 결론의 가치와 한계
현상 예측하기 : 기계학습
__기계학습 유형
__기계학습 개념
__기계학습 절차
[사례] 스몰데이터로 해보는 기계학습
데이터 스토리텔링
__데이터 스토리텔링 방법
__효과적인 데이터 스토리텔링 원칙
[사례] FiveThirtyEight
__서론
__본론
__결론
맺음말

5장 개인 데이터로 공부하는 데이터 과학
개인 데이터 활용으로 삶을 바꾸는 사람들
__개인 데이터 활용의 유형과 목표
__개인 데이터 활용 방법
[사례] 건강 및 식생활 지표화
__문제 정의하기
__건강 데이터화 및 개선하기
__식사 및 운동량 측정하기
__마치며
[사례] 정성적인 현상(행복) 지표화
__행복 측정 프로젝트
__행복을 측정하는 방법
__행복 측정의 결과
__마치며
개인 데이터 수집 및 분석 시작하기
__문제 탐색하기
__데이터 수집하기
__분석 및 결과 실천하기
__자신의 경험 공유하기
__마치며
맺음말

6장 공개 데이터로 공부하는 데이터 과학
공공 데이터를 통한 탐색적 분석
__문제 정의하기
__데이터 수집하기
__탐색적 데이터 분석
__유의사항 : 데이터를 검정하고 목표에 집중하라
경연 데이터를 통한 실전 예측 모델링
__경연 준비하기 : 나도 할 수 있을까
__캐글 참가자들의 성공 비결
__캐글 참여하기 : 타이타닉호 생존자 예측
비즈니스 성장을 위한 데이터 과학
[가상 사례] 식당 운영을 위한 데이터 과학
__식당 창업에 도전한 김 사장의 고민
__데이터 과학자인 조카의 조언
__메뉴의 변화가 매출에 미치는 영향
__고객의 만족도를 알아내는 방법은 무엇인가
__고객의 만족도를 알아내기 : 고객 행동 분석
__실험을 통한 신 메뉴 개발
__데이터 활용의 숨은 장벽들
__고객 유입의 단계별 데이터 활용
야구 통계를 통해 지표 개발 배우기
__야구 통계의 흐름
__야구 통계의 기초와 전통적인 지표들
__현대적인 야구 통계가 가져온 혁신
__마치며
맺음말 328

7장 입문을 넘어서 : 데이터 과학자의 길
데이터 과학자로 살아가기
__검색엔진 분야에서의 데이터 과학
__데이터 과학 프로젝트의 시작과 끝
__데이터 과학자의 일상
데이터 과학자가 되는 길
__나에게 어울리는 길인가
__무엇을 목표로 해야 하나
__어떻게 공부해야 하나
__어떻게 취업을 준비할 것인가
데이터 과학의 미래
__데이터 관련 기술적인 진보의 가속화
__데이터 과학의 더욱 폭넓은 활용
__데이터 과학자 수요 증가
맺음말

도서소개

★ 데이터 과학으로 생활 속 데이터를 활용하여 삶과 업무를 업그레이드하라!
MS 본사 데이터 과학자이면서 10년을 넘게 생활 데이터로 자신과 생활의 문제와 궁금증을 풀어온 저자는 거창한 과제가 아니라 다이어트하기, 건강해지기, 매출 늘리기 같은 생활 속에서 늘 존재하는 고민에 대한 데이터 과학적인 문제 해결 방법을 제시한다.
물론 전문적인 지식을 얻고자 하는 독자를 위해 빌 제임스 등이 창안한 야구 지표와 통계, 2008년과 2012년 미국 대선의 주별 결과를 정확하게 예측한 네이트 실버의 ‘항공 사고’ 관련 데이터 분석 사례, 넷플릭스 프라이즈의 1백만 달러의 상금을 건 문제 정의 사례 등도 다룬다.

이 책의 대표적인 [사례]는 다음과 같다.

- 스몰데이터로 해보는 기계학습
- 넷플릭스 프라이즈 문제 정의
- FiveThirtyEight 기사로 알아보는 데이터 저널리즘
- 건강 및 식생활 지표화
- 정성적인 현상(행복) 지표화
- (가상사례) 식당 운영을 위한 데이터 과학

이 책에서 다루는 [실습]은 다음과 같다.

- 엑셀로 하는 데이터 과학 맛보기
- R로 하는 데이터 과학 맛보기
- 엑셀로 해보는 탐색적 데이터 분석
- 엑셀로 해보는 통계적 추론

★ 이 책이 말하는 데이터 과학이란?
흔히 데이터 과학은 전문가를 위한 영역이라고 생각한다. 하지만 이 책은 비전문가를 위하여 복잡한 이론과 프로그래밍 없어도 할 수 있는 데이터 과학을 소개한다. 이 책의 사례와 예제를 보면서 ‘이게 데이터 과학이야?’라고 생각할 수도 있지만, 원래 데이터 과학은 데이터를 수집하고 분석하여 문제를 해결하고 결과를 소통하는 과정 전체를 가리키는 말이다. 이 책에서는 복잡하고 어려운 이론 대신에, 쉬우면서 독자들의 삶과 업무에 활용 가능한 예제와 실습에 초점을 맞추었다.

★ 삶과 업무를 바꾸는 데이터 과학의 가능성
필자는 미국의 대학원에서 데이터 과학의 첨단을 대표하는 분야인 정보 검색을 전공하여 박사학위를 받고, 현재 미국 마이크로소프트 온라인 서비스 부문에서 데이터 과학자로 근무하고 있다. 이는 매일 수많은 종류의 데이터를 접하고, 이를 바탕으로 다양한 분석을 수행하는 일이다. 이런 경험은 앞에서 언급한 데이터 혁명의 위력과 파급효과를 그 최전선에서 느낄 수 있게 해주었다.

특히 필자가 담당하는 업무는 미국 검색 트래픽의 30%를 담당하는 빙(Bing.com) 서비스의 품질 측정 및 개선을 위한 데이터 셋과 지표를 만드는 일이다. 검색엔진 개발의 모든 프로세스는 정량적인 지표에 따라 계획, 실행 및 평가되기 때문에 이는 조직의 방향을 결정하는 일이라고 할 수 있다. 또한 업무의 일부로 사내에서 데이터 수집 및 분석에 대한 교육을 진행하면서 데이터를 업무에 제대로 활용하기 위해서는 많은 노하우가 필요하다는 사실을 깨달았다.

보통 데이터라고 하면 일에만 적용하는 것으로 생각하기 쉽다. 그렇지만 필자는 업무 이외의 영역에서도 데이터를 활용하는 방법을 항상 고민해왔다. 대학을 다닐 때부터 ‘내가 행복하다고 느끼는 시간의 양을 최대화하는 것’이 인생의 목표 중 하나라고 여겨왔던 필자는 개인의 행복도를 측정하고 개선할 수 있는 방법을 찾기 위해 약 10년간 다양한 방법을 개발하였다. 그리고 최근에는 생산성, 건강, 인간관계 등 삶의 다른 영역에서도 비슷한 접근을 시도하고 있다.
미국에는 이처럼 개인 데이터 분석에 관심을 갖는 사람들이 ‘수치화된 나(Quantified Self)’라는 지역별 커뮤니티를 만들어 활동하고 있다. 필자는 2011년부터 보스턴 및 시애틀의 Quantified Self에 활발히 참여하면서 데이터 분석을 통해 자신의 목표를 달성하고 심지어 삶을 바꾸는 여러 경우를 목격하였다. 필자의 행복 측정 프로젝트도 여러 사람의 관심을 끌어 최근에 지역 신문에서 기사화하기도 했다.

이처럼 일과 삶에서 데이터를 활용하는 방법을 고민하면서, 필자는 데이터 과학이 어떤 특정한 산업이나 직업군의 사람에게만 가능한 일은 아니라고 확신하게 되었다. 또한 자신의, 혹은 주변의 데이터를 모으고 분석하는 방법에 대한 사례와 노하우를 블로그, 기고문 등을 통해 공유하기 시작했다. 이런 글들이 여러 사람의 관심과 격려를 받기 시작하면서, 필자는 더 많은 사람에게 이런 메시지를 전달하기 위한 방법을 고민하기 시작했다. 이 책은 그런 고민의 산물이다.

★ 대상 독자
데이터 과학에 대해 책을 쓰겠다는 결심을 하고 서점을 둘러보았을 때, 기존 데이터 과학 관련 책들이 ‘이미 데이터 과학자이거나 관련 분야의 전공자인 사람’을 대상으로 하고 있다는 사실을 발견했다. 그래서 그 이외의 사람들을, 구체적으로 다음에 해당하는 독자들을 염두에 두고 이 책을 썼다.

- 데이터 과학이 남의 이야기라고 생각하는 사람 : 1장은 왜 우리 모두가 데이터 과학에 관심을 가져야 하며, 데이터를 실제로 삶과 업무에 활용하는 것이 생각보다 어려운 일이 아님을 논하고 있다. 5장~6장에서 데이터 과학의 다양한 활용 사례를 찾을 수도 있을 것이다.
- 데이터 과학에 관심만 있는 사람 : 데이터 활용에 관심이 있었지만 어디서 시작할지 막막했던 사람이라면, 2장~4장에서 구체적인 방법과 따라 할 수 있는 예제를 찾을 수 있을 것이다.
- 데이터 과학을 더 잘 활용하고 싶은 사람 : 데이터 과학을 이미 어느 정도 활용하고 있는 사람이라면, 2장~4장의 방법론을 복습하고, 5장~6장의 사례를 살펴보도록 하자.
- 앞으로 데이터 과학자가 되려는 사람 : 데이터 과학자로서의 커리어에 관심이 있는 사람이라면, 앞 부분을 꼼꼼히 살펴본 후 7장에서 소개하는 다양한 자료를 참고하도록 하자.
- 데이터 과학자와 함께 일하려는 사람 : 직접 데이터 관련 업무를 담당하지 않더라도 데이터 과학자 및 분석가와 함께 일하는 독자들에게 이 책의 내용은 데이터 과학자 혹은 분석가의 세계를 이해하고 그들과 함께 일하는 데 도움이 될 것이다.

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 1800-7327
교환/반품주소
  • 경기도 파주시 문발로 211 1층 / (주)북채널 / 전화 : 1800-7327
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.