장바구니 담기 close

장바구니에 상품을 담았습니다.

Do it 쉽게 배우는 R 텍스트 마이닝

Do it 쉽게 배우는 R 텍스트 마이닝

  • 김영우
  • |
  • 이지스퍼블리싱
  • |
  • 2021-01-29 출간
  • |
  • 344페이지
  • |
  • 188 X 257 mm
  • |
  • ISBN 9791163032298
판매가

20,000원

즉시할인가

18,000

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
18,000

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평




R을 배웠는데 어떻게 써먹어야 할지 모르는 사람 모두 모여라!
실전에 주제별로 응용할 수 있는 학습·실습 구성으로 알차다!
텍스트 마이닝을 진짜 내가 할 수 있을까? 이 책과 함께라면 당연히 할 수 있다! 저자는 R에 입문한 사람이라면 누구나 따라 할 수 있는 구성으로 ‘완벽한 텍스트 마이닝 실습 매뉴얼’을 준비했다. 이 책은 텍스트 마이닝 실전 연습을 충분히 할 수 있도록 현재 우리 사회에서 이슈가 되고 있는 4가지 주제를 중심으로 데이터를 엄선하여 텍스트 마이닝 실습을 진행한다. ‘대통령 연설문’, ‘영화 〈기생충〉 오스카상 수상 댓글’, ‘타다 금지법 댓글’, ‘내년 대선 후보 댓글’의 4가지 실제 사례를 분석하며 개념을 이해하는 과정으로 구성해서 처음에는 복잡해 보이는 개념도 실습을 진행하다 보면 술술 이해될 것이다.
정말로, 진짜로, 어디까지 내 손으로 할 수 있을까?
형태소 분석부터 단어 분석, 감정 분석 등 ‘고급 데이터 분석 과정’ 모두 수록!
이제는 데이터 분석 기초 능력만 향상할 것이 아니라 실제 사례를 분석할 줄 아는 능력을 키워야 하는 시대가 되었다. 개발자, 마케터, 프로젝트 관리자 등 모두가 알아야 할 기초 소양이 된 것이다. 이 책은 문장을 구성하는 명사, 동사, 형용사 등과 같은 품사를 분류하는 작업인 형태소 분석부터 상대적으로 중요한 단어를 짚어 주는 ‘오즈비’, ‘로그 오즈비’ 활용, 감정 사전을 활용한 문장의 감정 분석, 동시 출현 네트워크를 활용한 단어 맥락 분석, 단어가 사용된 문단의 주제를 찾아 주는 ‘토픽 모델링’까지! ‘텍스트 데이터 분석 고급 과정’을 직접 해낸 사람으로 만들어 준다. 게다가 텍스트 데이터 분석이 편해지는 ‘꿀팁’부터 코드를 실행하다 함정에 빠지기 쉬운 부분까지 짚어 주니 그야말로 ‘텍스트 마이닝 꿀단지’이다.
내일 ‘사용자 선호도 분석’ 보고서를 제출해야 하는데 어떻게 하지?
보고서, 기사, 프레젠테이션에 바로 사용해도 손색없는 결과물을 이 책으로 만들어 보자!
저자는 “이 책을 집필할 때 바로 실무에 사용해도 될 수준의 텍스트 분석 과정과 시각화 과정을 포함하기 위해 노력했다.”고 강조한다. 현장에서 일하고 강의하면서 만난 후배와 수강자가 꼽은 국내 텍스트 마이닝 학습 콘텐츠의 가장 아쉬운 점이 ‘학습과 실제 업무의 괴리가 크다’였기 때문이다. 이 책은 그런 지점을 완벽하게 해소하고 있다. 한글 데이터를 다루는 텍스트 분석 과정은 실무에 가까운 수준이고, 분석 결과로 만드는 시각화 자료는 내일 당장 보고서, 신문 기사, 프레젠테이션 등에 사용해도 손색없는 수준이다.
저자는 당신이 어디에서 어떻게 어려워할지 다 알고 있다!
저자가 옆에 앉아 친절하게 설명해 주는 문장으로 감동받으며 공부하자!
텍스트 분석 과정은 가시밭길이다. 어디에서 어떤 문제가 벌어질지 모르기 때문이다. 하지만 저자는 이런 과정을 학습자ㆍ강의자 입장에서 모두 겪어 본 베테랑 중의 베테랑이다. 본문을 읽다 보면 저자가 옆에 앉아서 “여기는 아마 헷갈릴 텐데 이렇게 하면 쉽게 이해할 수 있을 겁니다.”라고 말해 주는 느낌을 받을 것이다. 또한 본문을 읽다가 궁금해할 만한 내용이나, 지금 당장 몰라도 되지만 결국은 알아야 할 내용은 본문 중간중간에 ‘꿀팁’, ‘알아두면 좋아요’로 풍부하게 배치했다.
베타테스터 후기
한국어 텍스트 분석, 이 책 한 권만 보면 됩니다!
텍스트 분석에 관심이 많아 출간 도서와 온라인 콘텐츠를 대부분 학습했고, 값비싼 교육 프로그램도 수강했습니다. 그런데도 늘 아쉬움이 많았습니다. 기존의 텍스트 분석 콘텐츠는 대부분 영어로 된 자료를 바탕으로 만들어진 것이었고, 코드 설명이 상세하지 않았기 때문입니다. 코드를 활용하려고 해도 이론 설명이 부족하여 항상 아쉬었습니다. 그런데 이 책의 알파테스터로 참여하면서 ‘앞으로 이 책의 독자는 이런 아쉬움은 없겠구나’ 하는 확신이 생겼습니다. 감히 ‘텍스트 분석 최고의 책’이라고 추천합니다. 여러분은 그저 편안한 마음으로 차근차근 따라가기만 하면 됩니다. 한국어 텍스트 분석은 이제 이 책으로 시작하고, 끝내세요.
- 기업에서 인공지능과 데이터 교육을 담당하는 분석 꿈나무_조영찬
R을 1도 모르는 R린이도 할 수 있어요!
내년 대선 댓글 분위기 분석은 제 손으로 직접 해봐야겠어요!
R을 1도 모르던 R린이가 바로 저였는데요. 저자 선생님의 《Do it! 쉽게 배우는 R 데이터 분석》으로 R 입문을 마친 다음 데이터 마이닝에 겁 없이 도전해 봤습니다. 그리고 책을 읽고 나서 데이터 분석으로 정말 많을 것을 할 수 있다는 점을 알고 무척 놀랐습니다. 평소에 접했던 뉴스나 기사 내용을 분석하니 오즈비, 로그 오즈비와 같은 개념도 이해하는 데 크게 어렵지 않았어요. 이 책 덕분에 정말 재미있고 즐겁게 공부했습니다. 나중에는 제가 직접 대선 후보 댓글을 분석해 봐야겠어요!
- R의 매력에 빠진 애독자_선명환
텍스트 마이닝이라는 표현 때문에 무작정 어렵게만 생각했는데...
실제 사례에 적용하며 공부하니 술술 이해가 됐어요!
평소에 데이터 분석에 관심이 많아서 ‘텍스트 마이닝’이라는 표현을 쉽게 접할 수 있었는데요. 표현이 주는 무게 때문인지 어렵게만 느껴져 데이터 분석 기초 공부만 하고 차마 손대지 못하고 있었습니다. 그런데 ‘기생충 오스카 수상 소식 댓글 분석’, ‘대통령 연설문 분석’, ‘타다 금지법 댓글 분석’과 같은 현실 사례를 놓고 공부할 수 있다고 하니 우선 뛰어들 수 있었어요! 조금 어려운 내용도 실제 사례로 설명하니 가깝게 느껴져서 개념을 더 쉽게 이해할 수 있었습니다. 무엇보다 본문 구성이 텍스트 마이닝의 절차를 순서대로 잘 배치해서 친절하게 알려 준다는 느낌을 받아 좋았습니다.
- 텍스트 마이닝이 무서웠던 R린이_김영준

국내 최고의 텍스트 데이터 분석 비법이 담긴 책!
국내 최고의 텍스트 데이터 분석 비법이 담긴 책입니다. 이 책을 보는 내내 빅데이터 전문가가 된 기분이 들었습니다. 아주 쉬운 설명으로 텍스트 마이닝의 데이터 분석 과정을 술술 진행할 수 있었고, 결과물도 다양해서 학습 만족도가 무척 높았습니다. 책에 나온 설명을 읽으면서 코드를 그대로 따라 가니 SNS부터 기사 댓글까지 텍스트를 분석할 수 있는 능력을 얻을 수 있었습니다. 앞으로 만날 무수히 많은 텍스트 데이터도 잘 분석할 수 있을 것 같네요. 여러분도 직접 텍스트 마이닝을 경험해 보세요!
- 데이터 분석가를 꿈꾸며 하루하루 공부하는 대학생_이동훈

R 텍스트 마이닝 특별 과정을 한 권으로 배울 수 있어요!
《Do it! 쉽게 배우는 R 데이터 분석》을 공부하면서 ‘텍스트 마이닝’ 과정을 알게 되었다면 이 책 1독을 강력 추천하고 싶습니다. 이 책은 텍스트 마이닝에서 꼭 공부해야 할 형태소 분석, TF-IDF, 감정 분석, 토픽 모델링 등과 같은 기초 이론부터 실제 데이터를 활용한 텍스트 분석 프로젝트까지 경험하게 해 줍니다. 책을 덮고 나면 텍스트 마이닝을 제대로 할 줄 아는 데이터 분석가가 되어 있을 것입니다. 오늘도 데이터 분석하느라 고생하셨습니다! :D
- 공공빅데이터 청년 인턴_김성범

- 이런 사람이 읽으면 좋아요
- 데이터 분석을 R로 입문한 사람(〈〈Do it! 쉽게 배우는 R 데이터 분석〉〉을 1독한 사람)
- 호기심 반, 진심 반으로 우리 주변의 다양한 텍스트를 실제로 분석해 보고 싶은 사람
- 텍스트 마이닝을 현업에 어떻게 적용해야 할지 막막한 예비 실무자
- 데이터 분석에 관심이 많은 대학교 3, 4학년 학부생
- 이지스퍼블리싱이 선사하는 독자 지원
공부하다 막히면 바로바로 참고하자! 저자 운영 깃허브
- 깃허브: github.com/youngwoos/Doit_textmining
이 책의 독자들과 함께 공부하고 책 선물도 받아 가세요!
- 두잇 스터디룸(책 질문 환영): cafe.naver.com/doitstudyroom
기술 관련 질문은 저자가 직접 운영하는 페이스북 그룹에 하세요!
- 저자 질문(기술 질문): www.facebook.com/groups/datacommunity


목차


__1장 단어 빈도 분석: 무엇을 강조했을까?
_01-1 텍스트 전처리
_01-2 토큰화하기
_01-3 단어 빈도 분석하기

__2장 형태소 분석기를 이용한 단어 빈도 분석
_02-1 형태소 분석
_02-2 명사 빈도 분석하기
_02-3 특정 단어가 사용된 문장 살펴보기

__3장 비교 분석: 무엇이 다를까?
_03-1 단어 빈도 비교하기
_03-2 오즈비 - 상대적으로 중요한 단어 비교하기
_03-3 로그 오즈비로 단어 비교하기
_03-4 TF-IDF - 여러 텍스트의 단어 비교하기

__4장 감정 분석: 어떤 마음으로 글을 썼을까?
_04-1 감정 사전 활용하기
_04-2 댓글 감정 분석하기
_04-3 감정 범주별 주요 단어 살펴보기
_04-4 감정 사전 수정하기

__5장 의미망 분석: 어떤 맥락에서 단어를 썼을까?
_05-1 동시 출현 단어 분석 - Co-occurrence analysis
_05-2 동시 출현 네트워크 - Co-occurrence network
_05-3 단어 간 상관 분석 - Phi coefficient
_05-4 연이어 사용된 단어쌍 분석 - n-gram

__6장 토픽 모델링: 어떤 주제로 글을 썼을까?
_06-1 토픽 모델링 개념 알아보기
_06-2 LDA 모델 만들기
_06-3 토픽별 주요 단어 살펴보기
_06-4 문서를 토픽별로 분류하기
_06-5 토픽 이름 짓기
_06-6 최적의 토픽 수 정하기

__7장 텍스트 마이닝 프로젝트: 타다 금지법 기사 댓글 분석
_07-1 주요 단어 살펴보기
_07-2 공감, 비공감 댓글 비교하기
_07-3 관심 댓글 비교하기
_07-4 단어 간 관계 살펴보기
_07-5 토픽 모델링

__8장 텍스트 마이닝 프로젝트: 차기 대선 주자 SNS 여론 분석
_08-1 SNS 언급량 추이 살펴보기
_08-2 SNS 이슈 살펴보기
_08-3 감정 단어 살펴보기
_08-4 감정 경향 살펴보기
_08-5 감정 추이 살펴보기
_08-6 긍정, 부정 트윗 단어 비교하기

__9장 텍스트를 효율적으로 분석하는 방법
_09-1 텍스트 데이터 수집하기
_09-2 텍스트 분석 품질 높이기
_09-3 완전 유용한 꿀팁

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 1800-7327
교환/반품주소
  • 경기도 파주시 문발로 211 1층 / (주)북채널 / 전화 : 1800-7327
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.