장바구니 담기 close

장바구니에 상품을 담았습니다.

모두를 위한 메타러닝

모두를 위한 메타러닝

  • 정창훈 외, 최성준 감수
  • |
  • 위키북스
  • |
  • 2022-10-25 출간
  • |
  • 284페이지
  • |
  • 188x240mm/540g
  • |
  • ISBN 9791158393670
판매가

26,000원

즉시할인가

23,400

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
23,400

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평

지도학습과 강화학습을 위한 최신 기술 메타러닝을 이해하자!

 

이 책은 최근 인공지능과 머신러닝 분야에서 각광받고 있는 메타러닝에 대한 입문 서적입니다. 독자 여러분께서 다소 생소할 수 있는 메타러닝에 대한 개념을 이해하고 실제로 세부 알고리즘들까지 구현해보는 기회를 제공하는 것을 목표로 합니다. 특히 메타러닝에서 회귀 문제, 분류 문제를 다루는 메타 지도학습뿐 아니라, 강화학습을 소개하고 이에 대해 메타러닝을 적용한 메타 강화학습까지 심도 있게 다루는 것이 이 책의 큰 장점입니다. 처음에는 다소 생소할 수 있지만, 꾸준히 이 책을 반복해서 읽고 실습하면 멋진 최신 머신러닝 기술인 메타러닝을 한층 깊이 이해할 수 있을 것입니다.

 

★ 이 책에서 배우는 내용 ★

 

◎ 아나콘다 설치와 활용, PyTorch 및 Torchmeta 라이브러리 활용

◎ 머신러닝에서의 메타러닝의 개념

◎ 메타 지도학습의 개념 및 여러 알고리즘 소개

◎ 기본 강화학습 개요

◎ 메타 강화학습의 개념 및 여러 알고리즘 소개

◎ 오픈챌린지와 메타러닝 애플리케이션 

목차

 

▣ 1장: 메타러닝 개요

1.1 머신러닝과 딥러닝

1.2 메타러닝이란?

1.3 메타러닝 학습 환경 구축

___1.3.1 아나콘다 설치와 사용

___1.3.2 아나콘다 설치

___1.3.3 깃허브 저장소 클론 및 환경 구축

 

▣ 2장: 메타 지도학습

2.1 메타러닝 문제 정의

___2.1.1 태스크 정의

___2.1.2 메타러닝 데이터셋

___2.1.3 메타러닝

___2.1.4 실습: Torchmeta 라이브러리 소개

2.2 모델 기반 메타러닝

___2.2.1 모델 기반 메타러닝의 핵심 개념

___2.2.2 NTM(Neural Turing Machines)

___2.2.3 MANN(Memory-Augmented Neural Networks)

___2.2.4 실습: MANN 구현

___2.2.5 SNAIL(Simple Neural Attentive Meta-Learner)

___2.2.6 실습: SNAIL 구현

2.3 최적화 기반 메타러닝

___2.3.1 전이학습과 최적화 기반 메타러닝

___2.3.2 MAML과 FOMAML

___2.3.3 실습: MAML-Regression

___2.3.4 실습: MAML-Classification

2.4 메트릭 기반 메타러닝

___2.4.1 KNN과 메트릭 기반 메타러닝

___2.4.2 Matching 네트워크

___2.4.3 실습: Matching 네트워크 구현

___2.4.4 Prototypical 네트워크

___2.4.5 실습: Prototypical 네트워크 구현

2.5 메타러닝 알고리즘 속성과 장단점

___2.5.1 메타러닝 알고리즘의 세 가지 속성

___2.5.2 메타러닝 알고리즘 비교

 

▣ 3장: 강화학습 개요

3.1 마르코프 결정 과정, 정책, 가치함수

___3.1.1 마르코프 결정 과정

___3.1.2 정책과 강화학습의 목표

___3.1.3 가치 함수

3.2 탐험과 활용

3.3 강화학습 알고리즘의 종류

___3.3.1 On-policy와 Off-policy

___3.3.2 정책 기반 알고리즘

___3.3.3 가치 기반 알고리즘

___3.3.4 액터 크리틱 알고리즘

3.4 TRPO(Trust Region Policy Optimization)

___3.4.1 TRPO 아이디어

___3.4.2 Surrogate 목적 함수와 제약 조건

___3.4.3 켤레 그라디언트법 기반 최적화

3.5 PPO(Proximal Policy Optimzation)

___3.5.1 PPO 아이디어

___3.5.2 Clipped Surrogate 목적함수

___3.5.3 PPO 알고리즘

3.6 SAC(Soft Actor Critic)

___3.6.1 엔트로피

___3.6.2 최대 엔트로피 강화학습

___3.6.3 가치함수 및 정책 학습

___3.6.4 SAC 알고리즘

 

▣ 4장: 메타 강화학습

4.1 메타 강화학습

___4.1.1 태스크 개념 소개

___4.1.2 메타 강화학습 문제 정의

___4.1.3 MuJoCo 및 Half-Cheetah 환경 개념 소개

4.2 순환 정책 메타 강화학습

___4.2.1 GRU

___4.2.2 순환 정책 메타 강화학습

___4.2.3 RL2

___4.2.4 실습: RL2 구현

4.3 최적화 기반 메타 강화학습

___4.3.1 MAML-RL

___4.3.2 실습: MAML-RL 구현

4.4 컨텍스트 기반 메타 강화학습

___4.4.1 태스크 추론 관점에서의 메타 강화학습

___4.4.2 컨텍스트 기반 정책

___4.4.3 변분적 추론

___4.4.4 PEARL(Probabilistic Embeddings for Actor critic RL)

___4.4.5 실습: PEARL 구현

 

▣ 5장: 오픈 챌린지와 메타러닝 애플리케이션

5.1 오픈 챌린지(Open Chanllenges)

___5.1.1 메타 과적합

___5.1.2 치명적 망각과 지속 학습

___5.1.3 부족한 벤치마크

___5.1.4 부족한 레이블된 데이터와 메타 비지도 학습

5.2 메타러닝 애플리케이션

___5.2.1 컴퓨터 비전

___5.2.2 강화학습

___5.2.3 자연어 처리

___5.2.4 의료

___5.2.5 마치며

도서소개

 

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 1800-7327
교환/반품주소
  • 경기도 파주시 문발로 211 1층 / (주)북채널 / 전화 : 1800-7327
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.