장바구니 담기 close

장바구니에 상품을 담았습니다.

파이썬과 대스크를 활용한 고성능 데이터 분석

파이썬과 대스크를 활용한 고성능 데이터 분석

  • 제시대니얼
  • |
  • 한빛미디어
  • |
  • 2020-09-17 출간
  • |
  • 360페이지
  • |
  • 183 X 235 mm
  • |
  • ISBN 9791162243305
판매가

28,000원

즉시할인가

25,200

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
25,200

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평




파이썬 병렬 컴퓨팅을 실현하는 대스크로 더 쉽고 효율적인 데이터 분석하기
파이썬을 이용한 데이터 작업을 경험해본 사람이라면 한 번쯤 팬더스와 넘파이 패키지를 접해봤을 것이다. 하지만 대스크라는 패키지는 조금 낯설 수 있다. 대스크는 데이터 과학 분야에서 매우 유용하게 활용할 수 있는 도구다. 특히 이 책은 ‘대용량 데이터의 병렬 처리’라는 주제를 이해하기 쉬운 비유와 상세한 설명을 통해 쉽게 풀어놓았다. 기존에 팬더스와 넘파이를 이용하여 데이터를 처리한 경험이 있는 개발자라면 코드 예제를 따라 하기만 해도 대스크의 기본 원리와 새로운 기능을 금방 파악할 수 있을 것이다. 이 책이 대스크라는 새로운 ‘강력한 무기’를 하나 더 장착할 좋은 기회가 되기를 바란다.
주요 내용
● 대규모 정형/비정형 데이터 작업하기
● 시본과 데이터 셰이더를 사용한 시각화
● 필요한 알고리즘 직접 구현하기
● Dask Distributed로 분산 앱 빌드
● 대스크 앱 패키징과 배포


목차


Part I 확장 가능한 컴퓨팅의 빌딩 블록

CHAPTER 1 왜 확장 가능한 컴퓨팅이 중요한가?
__1.1 왜 대스크인가?
__1.2 DAG 요리하기
__1.3 확장성, 동시성과 복구
__1.4 예제 데이터셋 소개
__1.5 마치며

CHAPTER 2 대스크 시작하기
__2.1 데이터 프레임 API와의 첫 만남
__2.2 DAG 시각화하기
__2.3 작업 스케줄링
__2.4 마치며

Part II 대스크 데이터 프레임을 이용해 정형 데이터 작업하기

CHAPTER 3 대스크 데이터 프레임 소개하기
__3.1 왜 데이터 프레임을 사용하는가?
__3.2 대스크와 팬더스
__3.3 대스크 데이터 프레임의 한계
__3.4 마치며

CHAPTER 4 대스크 데이터 프레임으로 데이터 불러오기
__4.1 텍스트 파일에서 데이터 읽기
__4.2 관계형 데이터베이스에서 데이터 읽어오기
__4.3 HDFS와 S3에서 데이터 읽어오기
__4.4 파케이 형식으로 데이터 읽어오기
__4.5 마치며

CHAPTER 5 데이터 프레임의 정리와 변환
__5.1 인덱스 및 축 작업하기
__5.2 결측값 다루기
__5.3 데이터 기록하기
__5.4 요소별 연산
__5.5 데이터 프레임의 필터링과 재색인
__5.6 데이터 프레임들을 조인하고 연결하기
__5.7 텍스트 파일과 파케이 파일에 데이터 쓰기
__5.8 마치며

CHAPTER 6 데이터 프레임 요약과 분석
__6.1 기술 통계
__6.2 내장된 집계 함수
__6.3 사용자 정의 집계 함수
__6.4 롤링(윈도우) 함수
__6.5 마치며

CHAPTER 7 시본 라이브러리로 데이터 프레임 시각화하기
__7.1 준비-리듀스-수집-플롯 패턴
__7.2 scatterplot 함수와 regplot 함수로 연속형 관계 시각화하기
__7.3 바이올린 플롯으로 범주형 관계 시각화하기
__7.4 히트맵으로 두 가지 범주형 관계 시각화하기
__7.5 마치며

CHAPTER 8 데이터 셰이더로 위치 데이터 시각화하기
__8.1 데이터 셰이더란 무엇이며 어떤 원리로 동작하는가?
__8.2 대화식 히트맵으로 위치 데이터 플로팅하기
__8.3 마치며

Part III 대스크의 확장과 배포

CHAPTER 9 백(Bags)과 배열 활용하기
__9.1 Bags으로 비정형 데이터 읽고 파싱하기
__9.2 요소 변형, 요소 필터링, 그리고 요소 폴딩하기
__9.3 Bags으로부터 배열 및 데이터 프레임 만들기
__9.4 자연어 툴킷으로 병렬 텍스트 분석을 위해 Bags 사용하기
__9.5 마치며

CHAPTER 10 대스크 ML을 이용한 머신러닝
__10.1 대스크 ML로 선형 모델 만들기
__10.2 대스크 ML 모델 평가 및 튜닝
__10.3 대스크 ML 모델 저장하기
__10.4 마치며

CHAPTER 11 대스크 확장 및 배포
__11.1 도커로 아마존 AWS에서 대스크 클러스터 빌드하기
__11.2 클러스터에서 대스크 작업 실행하고 모니터링하기
__11.3 AWS에서 대스크 클러스터 정리하기
__11.4 마치며

APPENDIX A 소프트웨어 설치
__A.1 아나콘다로 추가 패키지 설치하기
__A.2 아나콘다 없이 패키지 설치하기
__A.3 주피터 노트북 서버 시작하기
__A.4 NLTK 구성하기

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 1800-7327
교환/반품주소
  • 경기도 파주시 문발로 211 1층 / (주)북채널 / 전화 : 1800-7327
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.