★ 8단계로 정리한 RAG 파이프라인을 손에 익히는 완성형 학습 과정
LLM과 RAG의 기본 개념을 이해하고, LangChain의 기본 사용법과 LCEL 체인 구성 문법을 익히는 체계적인 과정으로 이뤄져 있다. RAG 파이프라인 8단계(문서 로드 → 텍스트 분할 → 임베딩 → 벡터 저장 → 리트리버 검색 → 프롬프트 생성 → LLM 응답 생성 → 체인 구성)를 하나하나 실습하며, 각 단계에서 활용할 수 있는 다양한 모듈과 도구(PDF 로더, 여러 종류의 텍스트 분할기, OpenAI 및 Hugging Face 임베딩, 다양한 벡터 데이터베이스, 고급 리트리버 등)를 익힌다. 이 과정에서 선택 가능한 옵션과 특성, 차이점을 비교해 가며 기본기를 탄탄히 다진다.
★ 다양한 모델을 짧게, 빠르게, 반복해서 실전 감각 완성
책 전반에 걸쳐 LLM 모델(OpenAI, Hugging Face, Upstage, Ollama 등), 문서 로더(PDF, HWP, CSV, 웹 데이터), 텍스트 분할기, 벡터 스토어(Chroma, FAISS, Pinecone), 리트리버, 메모리 시스템 구축 과정을 반복해서 실습한다. 각 기능별로 짧은 코드 예제와 실행 결과를 통해 자연스럽게 손에 익히게 하며, 다양한 선택지를 실습하고 비교함으로써 자신의 프로젝트 목적에 맞는 최적의 모델과 기능을 빠르게 고를 수 있는 실전 감각을 기른다. 또한 최신 논문의 기술도 소개하며 실습에 직접 적용해 볼 수 있다.
★ 상황별 챗봇 프로젝트로 배우는 실전형 RAG 시스템 구축
Streamlit 프레임워크를 활용하여 다양한 상황별 RAG 프로젝트를 직접 만든다. 문서 기반 질문 응답 챗봇, 이메일 업무 자동화 챗봇, 멀티모달 입력을 지원하는 이미지 기반 챗봇, 다양한 오픈소스 모델을 조합한 고급 RAG 챗봇 등 실전 사례를 직접 구현해 본다.
▶이 책이 필요한 독자
RAG 기본 개념부터 실제 구현까지 체계적으로 배우고자 하는 입문자들랭체인 프레임워크를 활용하여 RAG 시스템을 구축하려는 개발자들LLM의 한계를 극복하고 정확한 정보 검색과 응답 생성을 결합하려는 데이터 전문가들기업이나 조직에서 문서 검색, 이메일 자동화, 보고서 작성 등 실제 업무를 AI에 적용하려는 실무자들기초적인 파이썬 실력을 가진 비개발자지만 AI에 관심있는 사람들
▶ 이 책에서 다루는 내용
_PART 01 처음 만나는 LangChain
RAG의 기본 개념과 필요성을 이해하고, 환경 설정 방법, LLM 기본 용어, LangChain의 핵심 기능과 LCEL 문법을 학습한다. ChatOpenAI 설정, 멀티모달 모델, 체인 구성 등 LangChain의 기초를 다룬다.
_PART 02 프롬프트와 출력 파서
프롬프트 템플릿 생성, 부분 변수 활용, 퓨샷 프롬프트, 예제 선택기 등 다양한 프롬프트 기법과 PydanticOutputParser, JSON 파서, 데이터프레임 파서 등 출력 형식을 제어하는 방법을 배운다.
_PART 03 모델과 메모리
다양한 LLM 모델(OpenAI, Google, Hugging Face, Ollama 등) 활용법과 대화 버퍼, 토큰 버퍼, 요약 메모리, 벡터 스토어 검색 메모리 등 대화 내용을 기억하는 메모리 시스템 구축법을 다룬다.
_PART 04 데이터 로드와 텍스트 분할
PDF, HWP, CSV 등 다양한 문서 로더와 문자 단위, 토큰 단위, 의미 단위, 코드, 마크다운, HTML, JSON 등 다양한 방식의 텍스트 분할 방법을 학습한다.
_PART 05 벡터 스토어와 리트리버
OpenAI, HuggingFace 등 임베딩 모델과 Chroma, FAISS, Pinecone 등 벡터 스토어, 다양한 리트리버(문서 압축기, 앙상블, 다중 쿼리 생성, 셀프 쿼리 등) 활용법을 배운다.
_PART 06 LangChain 실습
Streamlit으로 ChatGPT 웹 앱, 이메일 자동화 챗봇, 다양한 모델 활용 챗봇, PDF 기반 RAG 챗봇 등 실제 프로젝트를 구현하며 앞서 배운 기술을 종합적으로 적용한다.