장바구니 담기 close

장바구니에 상품을 담았습니다.

SMACK 스택을 이용한 빠른 데이터 처리 시스템

SMACK 스택을 이용한 빠른 데이터 처리 시스템

  • 라울 에스트라다
  • |
  • 에이콘출판
  • |
  • 2017-12-13 출간
  • |
  • 468페이지
  • |
  • 188 X 235 X 24 mm
  • |
  • ISBN 9791161750828
판매가

30,000원

즉시할인가

27,000

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
27,000

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평

★ 이 책에서 다루는 내용 ★
ㆍ빠른 데이터 파이프 라인 아키텍처 설계 및 구현
ㆍ스칼라로 프로그래밍 문제를 함수적으로 생각하고 해결하는 방법
ㆍJVM에서 액터 모델 구현인 아카의 사용법 학습
ㆍ최신 비즈니스 요구 사항을 해결하기 위해 스파크로 메모리 프로세싱 및 데이터 분석 수행
ㆍ메소스와 도커를 사용해 강력하고 효과적인 클러스터 인프라 구축
ㆍ카산드라를 통해 비정형의 No-SQL 데이터 소스 관리와 사용
ㆍ카프카를 사용한 방대한 양의 메시지 생산과 소비

★ 이 책의 대상 독자 ★
오픈소스 데이터 스택 아키텍처를 가장 성공적으로 통합하는 방법과 모든 계층에서 올바른 기술을 선택하는 방법을 찾는 소프트웨어 개발자, 데이터 설계자, 데이터 엔지니어를 대상으로 한다. 또한 이 책은 모든 경우에서의 실질적인 장점을 제공한다.
각 기술에 대해 별도로 이야기하는 책은 많다. 이 책은 대체 기술을 찾는 사람들과 전체 스택을 연결하는 방법을 실용적인 예제로 다룬다.

★ 이 책의 구성 ★
1장, ‘SMACK 소개’에서는 SMACK의 기본 아키텍처에 대해 설명한다. SMACK 기술과 전통적인 데이터 기술의 차이점을 살펴본다. 또한 SMACK의 모든 기술을 살펴보고 각 툴의 잠재력을 간략히 보여준다.
2장. ‘모델: 스칼라와 아카’에서는 텍스트를 스칼라(언어)와 아카(JVM의 액터 모델 구현) 두 부분으로 나눠서 쉽게 만든다. 이 책은 예제를 통해 배울 수 있는 스칼라 아카의 미니 책이다. 전반부에서는 스칼라의 기본 내용을 설명하고, 후반부에서는 아카 액터 모델에 초점을 맞추고 있다.
3장, ‘엔진: 아파치 스파크’에서는 아파치 스파크의 핵심 사항을 처음부터 살펴본다. 아파치 스파크을 다운로드, 설치, 테스트하는 방법을 설명한다. 스파크 애플리케이션을 실행하는 방법을 배울 것이다. RDD와 RDD 오퍼레이션(트랜스포메이션 및 액션)과 같은 스파크 핵심 개념을 살펴본다. 클러스터 모드에서 아파치 스파크를 실행하는 방법, 드라이버 프로그램을 실행하는 방법, 고가용성을 달성하는 방법을 다룰 것이다. 3장에서는 스파크 스트리밍, 무상태 트랜스포메이션 및 상태 유지 트랜스포메이션, 출력 오퍼레이션, 고가용성을 높이는 방법, 스파크 스트리밍의 성능을 향상하는 방법에 대해 깊이 설명할 것이다.
4장, ‘저장소: 아파치 카산드라’에서는 저장소에 대해 설명한다. SMACK 스택의 C는 월마트(Walmart), CERN, 시스코(Cisco), 페이스북(Facebook), 넷플릿스(Netflix), 트위터(Twitter)와 같은 대기업에서 사용 중인 데이터베이스, 카산드라(Cassandra)를 의미한다. 스파크는 카산드라의 능력을 많이 사용한다. 스파크 카산드라 커넥터(Spark Cassandra Connector)를 사용하면 SMACK 애플리케이션의 효율성이 크게 향상된다.
5장, ‘브로커: 아파치 카프카’에서는 카프카(Kafka)가 개발된 이유를 설명하고 카프카 설치와 여러 타입의 클러스터를 지원하는 내용을 다룬다. 또한 카프카의 설계 방식을 살펴보고 여러 기본 프로듀서와 컨슈머를 사용한다. 단일 노드에서 단일 브로커 또는 다중 브로커를 사용해 카프카 클러스터를 설정하는 방법과 커맨드라인에서 프로듀서와 컨슈머를 실행하는 방법, 메시지를 교환하는 방법을 다룰 것이다. 브로커에 대한 몇 가지 중요한 설정에 대해서도 다룬다. 마지막으로 카프카와 스파크 같은 기술과 통합하는 방법에 대해 설명한다.
6장, ‘매니저: 아파치 메소스’에서는 메소스(Mesos) 아키텍처를 살펴보고 메소스의 자원 할당 방법과 DRF 알고리즘의 생성 방법을 설명한다. 또한 AWS와 사설 데이터 센터에서 메소스를 실행하는 방법을 보여준다. 가장 중요한 메소스 프레임워크인 마라톤(Marathon), 크로노스(Chronos), 오로라(Aurora), 싱귤러리티(Singularity)뿐 아니라 프레임워크 API도 설명한다. 또한 아파치 메소스 위에 스파크, 카산드라, 카프카를 실행하는 방법과 메소스를 사용한 분산 인프라에서 해당 프레임워크를 설치, 설정, 관리와 같은 주제를 다룰 것이다.
7장, ‘사례 연구 1 - 스파크와 카산드라’에서는 스파크와 카산드라의 관계에 대해 설명한다. 또한 스파크 카산드라 커넥터(Spark Cassandra Connector)와 카산드라와 스파크 컨텍스트(Spark Context) 설정 방법, 카산드라와 스파크 스트리밍, 스트리밍 컨텍스트 생성, 카산드라에서 스트림 읽기와 쓰기, 데이터 집합, 콜렉션, 튜플을 카산드라에 저장하는 방법, 콜렉션 수정, UDT와 RDD를 테이블에 저장하는 방법을 설명한다. 칼리오페(Calliope) 설치 및 설정, 카산드라에서 CQL3로 읽고 쓰기, 카산드라를 스리프트(Thrift)로 읽고 쓰는 칼리오페 프로젝트를 다룰 것이다.
8장, ‘사례 연구 2: 커넥터’에서는 즉 SMACK 스택 기술이 서로 통신할 수 있는 소프트웨어인 커넥터를 분석한다. 스파크와 카산드라의 관계는 매우 중요해서 5장에서 자세히 설명할 것이다.
9장, ‘사례 연구 3: 메소스와 도커’에서는 메소스 프레임워크를 개발하는 방법과 메소스 컨테이너라이저와 도커 컨테이너라이저를 사용하는 방법을 설명한다. 또한 프레임워크에 사용할 수 있는 메소스 API에 대해서도 다룬다. 게다가 메소스 컨테이너라이저와 도커 컨테이너라이저를 사용하는 방법을 설명할 것이다.

목차

1장. SMACK 소개

__최신 데이터 처리 문제
__데이터 처리 파이프라인 아키텍처
____NoETL 선언문
____람다 아키텍처
____하둡.
__SMACK 기술
____아파치 스파크
____아카
____아파치 카산드라
____아파치 카프카
____아파치 메소스
__데이터 센터 운영 변경
____스케일 업부터 스케일 아웃까지
____오픈소스 우위
____데이터 저장소 다변화
____데이터 중력 및 데이터 지역
____개발자 운영 규칙
__데이터 전문가 프로필
____데이터 아키텍트
____데이터 엔지니어
____데이터 애널리스트
____데이터 사이언티스트
__나를 위한 SMACK인가
__요약


2장. 모델: 스칼라와 아카

__언어: 스칼라
____카타 1: 컬렉션 계층구조
____카타 2: 올바른 컬렉션 선택
____카타 3: foreach 순회
____카타 4: for 순회
____카타 5: 반복자
____카타 6: 맵으로 변환하기
____카타 7: flatten
____카타 8: filter
____카타 9: 하위 시퀀스.
____카타 10: split
____카타 11: 유일한 엘리먼트 추출
____카타 12: 병합
____카타 13: 게으른 뷰
____카타 14: 정렬
____카타 15: 스트림
____카타 16: 배열
____카타 17: ArrayBuffer
____카타 18: 큐
____카타 19: 스택
____카타 20: 범위
__모델: 아카
____액터 모델 요약
____카타 21: 액터
____카타 22: 액터 통신
____카타 23: 액터 생명 주기
____카타 24: 액터 시작
____카타 25: 액터 중지카타 26: 액터 종료
____카타 27: 액터 시스템 셧다운
____카타 28: 액터 모니터링
____카타 29: 액터 검색.
____요약


3장. 엔진: 아파치 스파크

__싱글 모드의 스파크
____아파치 스파크 다운로드
____아파치 스파크 테스트
__스파크 핵심 개념.
__RDD
____스파크 애플리케이션 실행
____스파크 컨텍스트 초기화
____스파크 애플리케이션
____프로그램 실행
____RDD 오퍼레이션
____영속화(캐싱)
__클러스터 모드의 스파크.
____런타임 아키텍처
____스탠드얼론 클러스터 매니저
__스파크 스트리밍
____스파크 스트리밍 아키텍처
____트랜스포메이션
____출력 오퍼레이션
____내결함성을 지닌 스파크 스트리밍
____스파크 스트리밍 성능
____윈도우 크기와 배치 크기
____가비지 콜렉터
__요약


4장. 스토리지: 아파치 카산드라

__역사
__NoSQL
____NoSQL 또는 SQL?
____브루어의 CAP 이론172
__아파치 카산드라 설치..
____데이터 모델
____데이터 스토리지
____설치
____데이터스택스 옵스센터..
____키 스페이스 생성
__인증과 권한(역할)
____간단한 인증과 권한을 설정
__백업
____압축
__복구
____재시작 노드
____스키마 출력
____로그
____log4j 설정
____로그 파일 로테이션
____사용자 활동 로그
____트랙잭션 로그
____SQL 덤프
____CQL..
____DBMS 클러스터
____DB와 DBMS의 최적화
____블룸 필터
____데이터 캐시
____자바 힙 조정
____자바 가비지 컬렉션 조정
____뷰, 트리거, 저장 프로시저
____클라이언트-서버 아키텍처
__스파크 카산드라 커넥터
____커넥터 설치
____커넥션 연결
____커넥터 사용
__요약


5장. 브로커: 아파치 카프카

__카프카 소개
____아파치 카프카 기능
____빠른 데이터가 되기 위해 태어남
____사용 사례
__설치
____자바 설치
____카프카 설치
____카프카 임포트
__클러스터
____단일 노드 - 단일 브로커 클러스터
____단일 노드 - 다중 브로커 클러스터
____다중 노드-다중 브로커 클러스터
____브로커 속성
__아키텍처
____세그먼트 파일
____오프셋
____리더
____그룹
____로그 컴팩션
____카프카 설계
____메시지 압축
____복제
__프로듀서
____프로듀서 API
____스칼라 프로듀서
____자체 파티션을 가진 프로듀서
____프로듀서 설정
__컨슈머
____컨슈머 API
____간단한 스칼라 컨슈머
____멀티 스레드 스칼라 컨슈머
__통합
____아파치 스파크와 통합
__관리
____클러스터 툴
____서버 추가
____카프카 토픽 툴
____클러스터 미러링
__요약


6장. 관리자: 아파치 메소스

__아파치 메소스 아키텍처
____프레임워크
____기존 메소스 프레임워크
____속성과 자원
____아파치 메소스 API
__자원 할당
____DRF 알고리즘
____가중치 적용 DRF 알고리즘
____자원 설정
____자원 예약
__AWS에서 메소스 클러스터 실행하기
____AWS 인스턴스 타입
____AWS에 메소스 설치
____메소스 다운로드
____메소스 구축
__사설 데이터 센터에서 메소스 클러스터의 실행
____메소스 설치
____메소스의 일반적인 이슈
__스케줄링과 매니지먼트 프레임워크
____마라톤
____크로노스
____크로노스와 마라톤
__아파치 오로라
____오로라 설치
__싱귤래리티
____싱귤래리티 설치
__아파치 메소스에서의 아파치 스파크
____클라이언트 모드에서 작업 제출
____클러스터 모드에서 작업 제출
____추가 설정
__아파치 메소스에서 아파치 카산드라 사용
____추가 설정
__아파치 메소스에서 아파치 카프카 사용
____카프카 로그 관리
__요약


7장. 사례 연구 1: 스파크와 카산드라

__스파크 카산드라 커넥터
____필수 요건
____카산드라 준비
____스파크 컨텍스트 설정
____카산드라와 스파크 스트리밍
____스파크 스트리밍 설정
____카산드라 설정
____스트리밍 컨텍스트 생성
____스트림 생성
____데이터 집합을 카산드라로 저장
____카산드라의 객체 저장(사용자 정의 타입)
____카산드라 옵션을 스칼라 옵션으로 변환
____RDD를 새로운 테이블로 저장
____클러스터 배포
____스파크 카산드라 사용 사례
__연구 사례: 칼리오페 프로젝트
____칼리오페 설치
____CQL3
____스리프트
____칼리오페 SQL 컨텍스트 생성
____칼리오페 SQL 설정
__요약


8장. 사례 연구 2: 커넥터

__아카와 카산드라
____카산드라에 저장
____카산드라에서 읽기
____카산드라에 연결
____검색할 트윗
____검색 테스트
__아카와 스파크
__카프카와 아카
__카프카와 카산드라
__요약


9장. 사례 연구 3: 메소스와 도커

__메소스 프레임워크 API
____인증, 권한, 접근 제어
____프레임워크 인증
____인증 설정
____프레임워크 권한
____접근 제어 목록
__스파크 메소스의 실행 모드
____코오스 그레인드 모드
____파인 그레인드 모드
__아파치 메소스 API
____스케줄러 HTTP API
__메소스 컨테이너라이저
____컨테이너
__도커 컨테이너라이저
____컨테이너와 컨테이너라이저
____컨테이너라이저 타입
____컨테이너라이저 생성
____메소스 컨테이너라이저
____도커 컨테이너라이저
____컨테이너라이저 결합
__요약

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 1800-7327
교환/반품주소
  • 경기도 파주시 문발로 211 1층 / (주)북채널 / 전화 : 1800-7327
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.