장바구니 담기 close

장바구니에 상품을 담았습니다.

강화학습 /심층강화학습 실전 입문

강화학습 /심층강화학습 실전 입문

  • 오가와유타로
  • |
  • 위키북스
  • |
  • 2018-12-18 출간
  • |
  • 256페이지
  • |
  • 175 X 235 X 15 mm
  • |
  • ISBN 9791158391287
판매가

25,000원

즉시할인가

22,500

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
22,500

이 상품은 품절된 상품입니다

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

목차


▣ 01장: 강화학습이란 무엇인가?
1.1 머신러닝의 유형(지도학습, 비지도학습, 강화학습)
__용어 정리
__지도학습, 비지도학습, 강화학습
1.2 강화학습 및 심층강화학습의 역사
__강화학습과 뇌에서 일어나는 학습
__강화학습과 딥러닝의 결합
1.3 심층강화학습의 응용 사례
__심층강화학습의 응용 사례
__심층강화학습의 미래

▣ 02장: 미로찾기를 위한 강화학습 구현
2.1 주피터 노트북 체험 페이지 사용법
__이번 장에서 사용할 강화학습 구현 및 실행 환경
__주피터 노트북 체험 페이지 사용법
2.2 미로와 에이전트 구현
__미로 구현
__에이전트 구현
2.3 정책반복 구현
__정책반복과 가치반복
__정책경사 알고리즘에 따라 에이전트 이동시키기
__정책경사 알고리즘으로 정책 수정
__정책경사 알고리즘에 대한 이론
__보상
2.4 가치반복 알고리즘 관련 용어 정리
__행동가치와 상태가치
__벨만 방정식과 마르코프 결정 프로세스
__ε-greedy 알고리즘으로 정책 구현하기
2.5 Sarsa 알고리즘 구현
__행동가치 함수 Q(s,a)를 Sarsa 알고리즘으로 수정
__Sarsa로 미로찾기 구현
__Q러닝의 알고리즘
__Q러닝 구현
2.6 Q러닝 구현

▣ 03장: 역진자 문제를 위한 강화학습 구현
3.1 로컬 PC에 강화학습 개발환경 갖추기
__파이썬 실행 환경인 아나콘다 설치
__강화학습에 사용할 라이브러리 설치
3.2 역진자 태스크 “CartPole”
__CartPole이란?
__CartPole 구현
3.3 다변수, 연속값 상태를 표형식으로 나타내기
__CartPole의 상태
__상태의 이산변수 변환 구현
3.4 Q러닝 구현

▣ 04장: 파이토치를 이용한 딥러닝 구현
4.1 신경망과 딥러닝의 역사
__첫 번째 신경망 연구 붐
__두 번째 신경망 연구 붐
__세 번째 신경망 연구 붐
4.2 딥러닝의 계산 과정
__추론 단계
__학습 단계
4.3 파이토치를 이용한 MNIST 손글씨 이미지 분류 구현
__파이토치란?
__파이토치 개발환경 갖추기
__MNIST 데이터 다운로드
__파이토치를 이용한 딥러닝 구현
____1. 데이터 전처리
____2. DataLoader 생성
____3. 신경망 구성
____4. 오차함수 및 최적화 기법 설정
____5. 학습 및 추론 설정
____6. 학습 및 추론 수행
파이토치 사용법에 대한 보충 설명

▣ 05장: 딥러닝을 적용한 강화학습 - DQN 구현
5.1 딥러닝을 적용한 Q러닝
__표형식 표현의 문제점
__심층강화학습 알고리즘 DQN
5.2 DQN을 구현할 때 중요한 4가지 기법
5.3 DQN 구현(1)
__파이토치로 DQN을 구현할 때 주의점
__DQN 구현
5.4 DQN 구현(2)

▣ 06장: 딥러닝을 적용한 강화학습 - 심화 과정
6.1 심층강화학습 알고리즘 지도
6.2 DDQN(Double-DQN) 구현
__DDQN
__DDQN 구현
6.3 Dueling Network 구현
__Dueling Network
__Dueling Network 구현
6.4 Prioritized Experience Replay 구현
__Prioritized Experience Replay
__Prioritized Experience Replay 구현
6.5 A2C 구현
__A2C
__A2C 구현

▣ 07장: AWS GPU 환경에서 벽돌 깨기 구현
7.1 벽돌 깨기 게임 “Breakout”
7.2 AWS로 GPU를 사용하는 딥러닝 실행 환경 구성
__우분투 터미널 설치
__가상 서버와 통신하는 데 사용할 키 생성
__AWS에서 딥러닝을 실행할 가상 서버 만들기
__벽돌 깨기 게임 실행 환경 구축
7.3 Breakout 학습에서 중요한 포인트 4가지
__로컬 PC 환경 설정
__Breakout 게임을 학습하는 데 중요한 포인트 4가지
7.4 A2C 구현(1)
7.5 A2C 구현(2)

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 1800-7327
교환/반품주소
  • 경기도 파주시 문발로 211 1층 / (주)북채널 / 전화 : 1800-7327
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.