장바구니 담기 close

장바구니에 상품을 담았습니다.

DuckDB 인 액션

DuckDB 인 액션

  • 마크 니드햄
  • |
  • 인사이트
  • |
  • 2025-05-07 출간
  • |
  • 388페이지
  • |
  • 188 X 240 X 18mm
  • |
  • ISBN 9788966264773
판매가

28,000원

즉시할인가

25,200

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
25,200

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평

DuckDB를 먼저 사용한 사람들의 반응
“DuckDB를 처음 써본 날, 저는 분석 환경을 바꿨습니다.”
“DuckDB는 설치도 필요 없고, 그냥 실행하면 된다. 진짜로.”
“SQL은 아는데 Spark는 너무 크다 싶을 때, 딱 DuckDB였습니다.”
“20,000,000개 로우를 0.126초 만에 처리했다. 처음엔 의심했다.”

누구를 위한 책인가요?
* 클라우드 비용과 설정에 지친 데이터 엔지니어
* pandas로는 데이터가 벅찬 데이터 과학자
* SQL은 쓰지만 Spark는 부담스러운 개발자·실무자
* 프라이버시 중심 조직에서 분석해야 하는 실무자

이 책의 차별점
* CLI와 파이썬으로 배우는 실습 중심 구성
* JSON, CSV, Parquet 파일을 직접 쿼리하는 현장 예제
* DuckDB의 SQL 확장 기능 완전 해설
* MotherDuck 클라우드 버전까지 포함한 활용법
* 전체 예제 GitHub 제공, 최신 로컬 UI 설명 수록
* DuckDB v1.2.1 최신 버전 반영

“우리는 설명서를 쓰지 않았습니다.
“동료에게 설명하듯 썼습니다.”
_저자 서문 중


데이터 분석이 힘들어지는 순간, DuckDB가 필요하다
이제 DuckDB로 완전히 새롭게 경험하세요!
노트북 하나로 기가바이트 단위 데이터를 1초 만에 분석할 수 있다면 믿을 수 있을까? DuckDB라면 가능하다. CSV, JSON, Parquet 등 다양한 파일 형식, 심지어 압축된 파일까지 단 한 줄의 SQL만으로 바로 읽고 분석할 수 있다. 복잡한 설치 과정도, 데이터 웨어하우스 구축도 필요없다. 그냥 데이터와 노트북만 있으면 충분하다.

클라우드 비용과 복잡한 인프라, 이제는 안녕
DuckDB로 가볍게, 더 빠르게!
데이터 웨어하우스 구축이나 클라우드 서비스 이용에 드는 비용과 관리의 부담, DuckDB 앞에서는 고민할 필요가 없다. CSV, JSON, Parquet뿐 아니라 Delta Lake, Iceberg, S3, SQLite, MySQL, PostgreSQL까지 어떤 데이터든 별도 변환 없이 즉시 분석할 수 있다. 이제 당신의 데이터 분석이 놀랍도록 간단해진다.

배우지 않아도 이미 할 줄 아는 데이터베이스
DuckDB는 지금 바로 쓸 수 있다
새로운 데이터베이스를 쓰려면 복잡한 문서를 읽고 수많은 튜토리얼을 봐야 할까? DuckDB는 다르다. 이미 알고 있는 SQL 문법 그대로 사용할 수 있고 SQL만으로 부족한다면 파이썬과의 완벽한 통합으로 자유롭게 확장할 수도 있다. 로컬에서 더 큰 성능이 필요하다면 DuckDB의 클라우드 버전인 MotherDuck으로 언제든지 쉽게 확장 가능하다.

이 책에서 다루는 내용
* CSV, JSON, Parquet 형식의 데이터를 로컬 또는 원격에서 읽고 처리하는 방법
* 집계, 공통 테이블 표현식(CTE), 윈도 함수, 조인, 피벗 테이블 등 다양한 SQL 기능을 활용한 분석용 쿼리 작성
* 파이썬에서 DuckDB를 사용해 SQL과 관계형 API를 모두 활용하고, 데이터프레임과 상호작용하는 방법
* 대규모 데이터세트를 수집, 준비, 쿼리하는 실전 예제
* 클라우드 환경에서 데이터 파이프라인을 구축하고 활용하는 전략
* 사용자 정의 함수와 확장 기능으로 DuckDB를 커스터마이징하는 방법
* Streamlit으로 맞춤형 데이터 앱 구축하기
* Apache Superset으로 BI 대시보드 구축하기
* Polars, pandas, Apache Arrow와의 상호운용성

목차

1장 DuckDB 소개
__1.1 DuckDB란 무엇인가요?
__1.2 왜 DuckDB에 주목해야 할까요?
__1.3 언제 DuckDB를 사용하는 게 좋을까요?
__1.4 언제 DuckDB를 사용하지 말아야 할까요?
__1.5 사용 사례
__1.6 DuckDB는 어디에 적합할까요?
__1.7 데이터 처리 흐름 단계
__요약

2장 DuckDB 시작하기
__2.1 지원되는 환경
__2.2 DuckDB CLI 설치하기
__2.3 DuckDB CLI를 사용하는 방법
__2.4 DuckDB의 확장 시스템
__2.5 CSV 파일을 DuckDB CLI로 분석하기
__요약

3장 SQL 쿼리 실행하기
__3.1 간단한 SQL 복습
__3.2 에너지 생산 분석하기
__3.3 데이터 정의 언어 쿼리
__3.4 데이터 조작 언어 쿼리
__3.5 DuckDB 전용 SQL 확장
__요약

4장 데이터의 고급 집계와 분석
__4.1 데이터 수집 중에 사전 집계하기
__4.2 데이터 요약하기
__4.3 서브쿼리
__4.4 그룹화 집합
__4.5 윈도 함수들
__4.6 WHERE 절 외부에서 조건과 필터링 처리하기
__4.7 PIVOT 문
__4.8 ASOF JOIN 사용하기
__4.9 테이블 함수 사용하기
__4.10 LATERAL 조인 사용하기
__요약

5장 지속성 없이 데이터 탐색하기
__5.1 왜 데이터를 따로 보존하지 않고 데이터베이스를 사용할까요?
__5.2 파일 유형과 스키마 추론하기
__5.3 중첩된 JSON 쪼개기
__5.4 CSV를 Parquet로 변환하기
__5.5 Parquet 파일 분석하고 쿼리하기
__5.6 SQLite와 다른 데이터베이스 쿼리하기
__5.7 엑셀 파일로 작업하기
__요약

6장 파이썬 생태계와 통합하기
__6.1 시작하기
__6.2 관계형 API 사용하기
__6.3 pandas 데이터프레임 쿼리하기
__6.4 사용자 정의 함수
__6.5 Apache Arrow 및 Polars와의 상호운용성
__요약

7장 DuckDB를 클라우드에서 MotherDuck과 함께 사용하기
__7.1 MotherDuck 소개
__7.2 MotherDuck으로 시작하기
__7.3 MotherDuck 최대한 활용하기
__요약

8장 DuckDB로 데이터 파이프라인 구축하기
__8.1 데이터 파이프라인과 DuckDB의 역할
__8.2 dlt를 사용한 데이터 수집
__8.3 dbt를 사용한 데이터 구조 변환과 모델링
__8.4 Dagster로 데이터 파이프라인을 오케스트레이션하기
__요약

9장 데이터 앱 구축 및 배포
__9.1 Streamlit으로 맞춤형 데이터 앱 구축하기
__9.2 Apache Superset으로 BI 대시보드 구축하기
__요약

10장 대규모 데이터세트에 대한 성능 고려사항
__10.1 스택 오버플로 전체 데이터베이스 불러오기와 쿼리하기
__10.2 쿼리 계획 및 실행
__10.3 스택 오버플로 데이터를 Parquet로 내보내기
__10.4 Parquet 파일에서 뉴욕시 택시 데이터세트 탐색하기
__요약

11장 결론
__11.1 이 책에서 배운 내용
__11.2 DuckDB의 향후 안정 버전들
__11.3 다루지 못한 내용
__11.4 더 배울 수 있는 곳은?
__11.5 DuckDB와 함께하는 데이터 엔지니어링의 미래는 어떨까요?

부록 A DuckDB를 위한 클라이언트 API
__A.1 공식 지원 언어
__A.2 동시성에 관한 간략한 설명
__A.3 사용 사례
__A.4 대용량 데이터 가져오기
__A.5 JDBC 드라이버를 통해 자바에서 DuckDB 사용하기
__A.6 추가 연결 옵션들
__요약

부록 B DuckDB UI
__B.1 DuckDB UI 소개
__B.2 이 책의 예제를 DuckDB UI로 실행하기
__요약

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 1800-7327
교환/반품주소
  • 경기도 파주시 문발로 211 1층 / (주)북채널 / 전화 : 1800-7327
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.