목차
1장 빅데이터 처리 및 분석 개요
1.1 빅데이터 무엇인가?
1.2 빅데이터 과정
1.3 빅데이터 처리 및 분석을 위한 분산 컴퓨팅
1.4 빅데이터 처리 및 분석을 위한 구성요소
2장 윈도우에 리눅스 설치하기
2.1 윈도우와 리눅스 함께 사용 방법
2.2 가상머신 설치를 위한 VMware 설치
2.3 리눅스 다운로드
2.4 VMware 이용하여 가상머신에 리눅스 설치
3장 리눅스 사용법
3.1 우분투의 도크
3.2 터미널 사용하기
3.3 리눅스 편집기
4장 리눅스 파일과 디렉터리 다루기
4.1 파일과 디렉터리의 개념
4.2 리눅스 기본 명령어
4.3 파일 및 디렉터리 권한
4.4 윈도우와 리눅스 파일 공유하기
5장 리눅스에서 하둡 사용하기
5.1 하둡 개요
5.2 하둡 설치
5.3 하둡 실행
5.4 하둡 웹 인터페이스
5.5 예제를 이용한 하둡 맛보기
6장 Spark
6.1 Spark의 개념
6.2 Spark의 데이터 구조
6.3 Spark 설치
6.4 Spark 설치 확인
6.5 주피터 노트북에서 Scala 사용하기
7장 Scala 언어
7.1 Scala 기본 문법
7.2 Spark 상에서 Scala 프로그래밍
8장 Spark 머신러닝
8.1 Spark MLlib과 Spark ML
8.2 Spark 머신러닝 파이프라인
8.3 머신러닝 회귀모델
8.4 머신러닝 분류모델
9장 리눅스에 R과 RStudio 설치
9.1 R 설치
9.2 RStudio 설치
10장 SparkR
10.1 SparkR 개념
10.2 SparkR을 이용한 데이터 분석
11장 SparkR 머신러닝
11.1 SparkR 머신러닝 알고리즘
11.2 SparkR 환경 설정
11.3 SparkR에서 머신러닝 구현
찾아보기