강화학습 /심층강화학습 실전 입문- 북채널

장바구니 담기

장바구니에 상품을 담았습니다.

장바구니로 계속쇼핑하기

컴퓨터/IT

사전 경제/경영 문학 만화 대학교재 과학 가정/건강/생활 정치/사회 어린이 여행/지도 역사/문화 예술/대중문화 외국도서 외국어/어학 유아 인문 인물 잡지 종교 청소년 취미/레저 컴퓨터/IT 수험서/자격증 학술도서 기술/공학 초등참고서 중/고등참고서 전자책
컴퓨터공학

컴퓨터입문/활용 OS/Networking e비즈니스/창업 OA/사무자동화 홈페이지/웹 컴퓨터공학 프로그래밍 일반 그래픽/멀티미디어 개발/방법론 자격증 IT에세이 전산통계/해석 게임 모바일프로그래밍 웹사이트 CAD
인공지능

네트워크/데이터통신 데이터베이스 마이크로프로세서 소프트웨어공학 자료구조/알고리즘 전산수학 정보통신공학 컴퓨터공학/전산학개론 인공지능 IT일반 유비커터스/RFID 컴퓨터공학/과학개론 컴퓨터구조 운영체제론 정보시스템

미리보기

무료배송소득공제

강화학습 /심층강화학습 실전 입문

오가와유타로
|
위키북스
|
2018-12-18 출간
|
256페이지
|
175 X 235 X 15 mm
|
ISBN 9791158391287

판매가: ~~25,000원~~

즉시할인가: 22,500 원

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

추가상품

상품선택: 독서대 7,900원 독서대 선택안함 0원

수량: + -

총주문금액: 22,500원

이 상품은 품절된 상품입니다

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

북스크린영상으로 만나보는 한 권의 책 이야기

목차: ▣ 01장: 강화학습이란 무엇인가?
1.1 머신러닝의 유형(지도학습, 비지도학습, 강화학습)
__용어 정리
__지도학습, 비지도학습, 강화학습
1.2 강화학습 및 심층강화학습의 역사
__강화학습과 뇌에서 일어나는 학습
__강화학습과 딥러닝의 결합
1.3 심층강화학습의 응용 사례
__심층강화학습의 응용 사례
__심층강화학습의 미래

▣ 02장: 미로찾기를 위한 강화학습 구현
2.1 주피터 노트북 체험 페이지 사용법
__이번 장에서 사용할 강화학습 구현 및 실행 환경
__주피터 노트북 체험 페이지 사용법
2.2 미로와 에이전트 구현
__미로 구현
__에이전트 구현
2.3 정책반복 구현
__정책반복과 가치반복
__정책경사 알고리즘에 따라 에이전트 이동시키기
__정책경사 알고리즘으로 정책 수정
__정책경사 알고리즘에 대한 이론
__보상
2.4 가치반복 알고리즘 관련 용어 정리
__행동가치와 상태가치
__벨만 방정식과 마르코프 결정 프로세스
__ε-greedy 알고리즘으로 정책 구현하기
2.5 Sarsa 알고리즘 구현
__행동가치 함수 Q(s,a)를 Sarsa 알고리즘으로 수정
__Sarsa로 미로찾기 구현
__Q러닝의 알고리즘
__Q러닝 구현
2.6 Q러닝 구현

▣ 03장: 역진자 문제를 위한 강화학습 구현
3.1 로컬 PC에 강화학습 개발환경 갖추기
__파이썬 실행 환경인 아나콘다 설치
__강화학습에 사용할 라이브러리 설치
3.2 역진자 태스크 “CartPole”
__CartPole이란?
__CartPole 구현
3.3 다변수, 연속값 상태를 표형식으로 나타내기
__CartPole의 상태
__상태의 이산변수 변환 구현
3.4 Q러닝 구현

▣ 04장: 파이토치를 이용한 딥러닝 구현
4.1 신경망과 딥러닝의 역사
__첫 번째 신경망 연구 붐
__두 번째 신경망 연구 붐
__세 번째 신경망 연구 붐
4.2 딥러닝의 계산 과정
__추론 단계
__학습 단계
4.3 파이토치를 이용한 MNIST 손글씨 이미지 분류 구현
__파이토치란?
__파이토치 개발환경 갖추기
__MNIST 데이터 다운로드
__파이토치를 이용한 딥러닝 구현
____1. 데이터 전처리
____2. DataLoader 생성
____3. 신경망 구성
____4. 오차함수 및 최적화 기법 설정
____5. 학습 및 추론 설정
____6. 학습 및 추론 수행
파이토치 사용법에 대한 보충 설명

▣ 05장: 딥러닝을 적용한 강화학습 - DQN 구현
5.1 딥러닝을 적용한 Q러닝
__표형식 표현의 문제점
__심층강화학습 알고리즘 DQN
5.2 DQN을 구현할 때 중요한 4가지 기법
5.3 DQN 구현(1)
__파이토치로 DQN을 구현할 때 주의점
__DQN 구현
5.4 DQN 구현(2)

▣ 06장: 딥러닝을 적용한 강화학습 - 심화 과정
6.1 심층강화학습 알고리즘 지도
6.2 DDQN(Double-DQN) 구현
__DDQN
__DDQN 구현
6.3 Dueling Network 구현
__Dueling Network
__Dueling Network 구현
6.4 Prioritized Experience Replay 구현
__Prioritized Experience Replay
__Prioritized Experience Replay 구현
6.5 A2C 구현
__A2C
__A2C 구현

▣ 07장: AWS GPU 환경에서 벽돌 깨기 구현
7.1 벽돌 깨기 게임 “Breakout”
7.2 AWS로 GPU를 사용하는 딥러닝 실행 환경 구성
__우분투 터미널 설치
__가상 서버와 통신하는 데 사용할 키 생성
__AWS에서 딥러닝을 실행할 가상 서버 만들기
__벽돌 깨기 게임 실행 환경 구축
7.3 Breakout 학습에서 중요한 포인트 4가지
__로컬 PC 환경 설정
__Breakout 게임을 학습하는 데 중요한 포인트 4가지
7.4 A2C 구현(1)
7.5 A2C 구현(2)

추천포스트

교환 및 환불안내

도서교환 및 환불	ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.) ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다. ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다. ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다. ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다. ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.) ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다. ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다. ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다. ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다. ㆍ군부대(사서함) 및 해외배송은 불가능합니다. ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내	마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 : 070-4821-5101
교환/반품주소	부산광역시 부산진구 중앙대로 856 303호 / (주)스터디채널 / 전화 : 070-4821-5101 택배안내 : CJ대한통운(1588-1255) 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.

패밀리사이트

Company info

Address

주소 : 부산광역시 부산진구 중앙대로 856 303호

CS center

고객센터 070-4821-5101
평일 09:00 ~ 17:30 토·공휴일 휴무

에스크로

도서 카테고리

스테디셀러

베스트셀러

진행중인 이벤트/기획전

강화학습 /심층강화학습 실전 입문

북스크린영상으로 만나보는 한 권의 책 이야기

목차

교환 및 환불안내