장바구니 담기 close

장바구니에 상품을 담았습니다.

Do it 데이터 분석을 위한 판다스 입문 (개정판)

Do it 데이터 분석을 위한 판다스 입문 (개정판)

  • 다니엘 첸
  • |
  • 이지스퍼블리싱
  • |
  • 2023-11-20 출간
  • |
  • 400페이지
  • |
  • 188 X 257 X 16mm
  • |
  • ISBN 9791163035282
판매가

25,000원

즉시할인가

22,500

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
22,500

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평

이 책의 주요 내용
ㆍ 판다스로 깔끔한 데이터셋을 만들어 이를 결합, 그룹화, 병합, 분할 등 데이터 분석의 기초를 설명
ㆍ 정규화, 조인, 그룹화 등 SQL 개념을 이용하여 데이터를 다루는 방법을 소개
ㆍ 맷플롯립, 시본 등을 활용하여 데이터 시각화의 기본인 그래프를 그리는 방법을 안내
ㆍ 빌보드 차트, 에볼라 및 인플루엔자 데이터셋, 날씨 데이터셋, 은행 정보 데이터셋, 주식 데이터셋 등 현실 데이터를 활용한 판다스 예제로 실습 구성

수많은 파이썬 라이브러리 가운데 ‘판다스’를 왜 알아야 할까?
데이터 분석 전문가로 가는 출발점에 판다스가 있습니다!
파이썬은 데이터 분석 분야에서 가장 많이 활용되고 있습니다. 판다스는 데이터 분석 라이브러리 가운데 활용도가 가장 높은 파이썬 라이브러리입니다. 데이터 분석과 관련한 다른 파이썬 라이브러리가 계속 생겨나지만 거의 대부분 판다스에 의존하고 있으니 판다스는 기본 상식처럼 알아 두어야 합니다. 이러한 판다스를 대체할 도구는 당분간 찾기 어려울 것입니다.

R? 파이썬? 엑셀? 대체 뭘로 데이터 분석을 시작해야 돼?
판다스에 입문해 이 고민을 해결해 보세요!
R의 장점을 파이썬으로 가지고 올 수 있었던 것은 바로 판다스 덕분입니다. R에서 파이썬으로 분석 방법을 바꾸고 싶다면 판다스를 시작하세요! 또한 공공기관, 연구기관에서 사용하는 CSV, TSV 등 대량의 데이터 파일을 판다스로 다룰 수 있어 실무에서 의사결정을 할 때 기초 자료를 만드는 데 도움이 될 것입니다. 그동안 엑셀에서 규모가 큰 데이터를 분석할 때 컴퓨터가 버벅거린 경험이 있다면 파이썬 문법을 거의 몰라도 괜찮으니 이 책으로 판다스에 입문해 보세요. 이 책으로 공부하면 데이터 분석을 정말 쉽게 시작할 수 있습니다.

독학 교재로도, 스터디 교재로도 강추!
매일 2시간씩, 10일 공부해 판다스 기초를 정복해 보세요!
이 책으로 2시간씩 10일을 공부하면 파이썬을 거의 몰라도 판다스의 기초를 마스터할 수 있습니다. 특히 이 책은 원서에 없는 아나콘다, 주피터 노트북, pip과 같은 판다스 실습 환경을 구성하는 준비 과정을 따라 하기 쉽게 친절히 설명했습니다. 또한 날씨 관측 데이터, 주식 데이터, 빌보드 차트 등 다양한 데이터를 이용해 데이터 분석 작업 단위로 나눠 실습을 진행하므로 초보자도 겁먹지 않고 예제를 따라 할 수 있도록 구성했습니다. 파이썬이나 데이터 분석을 잘 안다면 5일 만에도 이 책을 정복할 수 있으니 도전해 보세요!

한 가지 더! 저자가 꼼꼼히 남긴 공식 문서를 꼭 활용하여 학습해 보세요
이 책 전반에 걸쳐 판다스 실습과 관련된 다양한 공식 문서 링크를 꼼꼼히 남겼습니다. 학습하다 궁금한 점이 있거나 판다스 함수나 메서드 등 자세한 내용을 알고 싶을 땐 반드시 이 링크를 따라 공식 문서를 확인해 보세요. 이 책과 공식 문서를 통해 판다스의 기본기를 갖추고 나서 데이터 분석 전문서나 강의에 도전한다면 데이터 분석 전문가로 거듭날 수 있어요!

이 책의 데이터셋과 실습 파일은 이지스퍼블리싱 홈페이지 자료실 또는 깃허브에서 제공합니다
ㆍ 이지스퍼블리싱 홈페이지: www.easyspub.co.kr → [자료실] 클릭 → ‘판다스’ 또는 도서명 검색
ㆍ 이지스퍼블리싱 깃허브: github.com/EasysPublishing/do_it_pandas

함께 배우고, 나누고, 성장하는 ‘Do it! 스터디룸’으로 오세요!
혼자 계획을 세우고 공부하다 보면 금방 지치기 마련입니다. 어려운 내용은 나와 비슷한 고민을 하는 독자를 만나 공유해 보세요. 서로 도움을 주고받으며 공부하다 보면 더 보람차니까요!
ㆍ Do it! 스터디룸: cafe.naver.com/doitstudyroom

목차

01 판다스 실습 환경 준비하기
__01-1 아나콘다 설치하기
__01-2 판다스 실습 준비하기
__01-3 안녕? 주피터 노트북!
__01-4 파이썬 패키지 관리자 pip 알아보기

02 판다스 시작하기
__02-1 판다스가 왜 필요할까?
______ 데이터프레임과 시리즈
__02-2 데이터셋 불러오기
______ 데이터 분석은 데이터셋 불러오기부터
__02-3 데이터 추출하기
______ 열 데이터 추출하기
______ 행 데이터 추출하기
______ loc와 iloc로 데이터 추출하기
______ 행과 열 함께 지정하여 추출하기
__02-4 기초 통계 계산하기
______ 그룹화한 데이터의 평균 구하기
______ 그룹화한 데이터 개수 세기
__02-5 데이터를 그래프로 표현하려면?

03 판다스 자료구조 살펴보기
__03-1 나만의 데이터 만들기
______ 시리즈와 데이터프레임 만들기
__03-2 시리즈 다루기
______ 시리즈의 keys() 메서드
______ 시리즈와 ndarray
______ 시리즈와 불리언
______ 시리즈와 브로드캐스팅
__03-3 데이터프레임 다루기
______ 데이터프레임의 구성
______ 데이터프레임과 불리언 추출
______ 데이터프레임과 브로드캐스팅
__03-4 시리즈와 데이터프레임 데이터 변환하기
__03-5 데이터 저장하고 불러오기
______ 피클로 저장하고 불러오기
______ CSV와 TSV 파일로 저장하고 불러오기
______ 엑셀로 저장하기
______ 다양한 형식으로 저장하기
______ 다양한 데이터 저장 유형

04 그래프 그리기
__04-1 데이터 시각화란?
__04-2 matplotlib 라이브러리란?
______ 그림 영역과 하위 그래프 이해하기
______ 그래프 구성 요소 이해하기
__04-3 matplotlib으로 그래프 그리기
______ 일변량 그래프 그리기
______ 이변량 그래프 그리기
______ 다변량 그래프 그리기
__04-4 seaborn으로 그래프 그리기
______ 다양한 그래프 그려 보기
______ seaborn 스타일 알아보기
______ seaborn 공식 문서 읽는 방법
__04-5 판다스로 그래프 그리기

05 깔끔한 데이터 만들기
__05-1 깔끔한 데이터란?
__05-2 열 이름이 값일 때
______ 하나의 열만 남기기
______ 여러 개의 열 남기기
__05-3 열 이름에 변수가 여러 개일 때
______ 열 이름이 여러 가지 뜻일 때
______ 열 이름 분할하고 새로운 열로 할당하기
______ 한 번에 분할하고 합치기
__05-4 변수가 행과 열 모두에 있을 때

06 apply() 메서드로 함수 적용하기
__06-1 간단한 함수 만들기
__06-2 apply() 메서드 사용하기
______ 시리즈에 함수 적용하기
______ 데이터프레임에 함수 적용하기
__06-3 람다 함수 사용하기
__06-4 벡터화된 함수 사용하기
______ 넘파이와 넘바로 벡터화하기

07 데이터 결합하고 분해하기
__07-1 데이터 묶어 분석하기
__07-2 데이터 연결하기
______ 데이터프레임 살펴보기
______ 행 연결하기
______ 열 연결하기
______ 인덱스나 열 이름이 다른 데이터 연결하기
__07-3 분할된 데이터 연결하기
__07-4 여러 데이터셋 병합하기
__07-5 데이터 정규화하기

08 그룹으로 묶어 연산하기
__08-1 데이터 집계하기
______ groupby() 메서드와 함께 사용하는 집계 메서드
______ agg() 메서드와 groupby() 메서드 조합하기
______ 여러 개의 집계 함수 한 번에 사용하기
__08-2 데이터 변환하기
______ 표준점수 계산하기
______ 평균값으로 결측값 채우기
__08-3 원하는 데이터 걸러 내기
__08-4 그룹 객체 활용하기
______ 그룹 객체란?
__08-5 다중 인덱스 다루기

09 결측값 알아보기
__09-1 결측값이란?
__09-2 결측값은 왜 생길까?
______ 데이터를 불러올 때 생기는 결측값
______ 데이터를 연결할 때 생기는 결측값
______ 직접 입력한 결측값
______ 인덱스를 다시 설정할 때 생기는 결측값
__09-3 결측값 다루기
______ 결측값 처리하기
______ 결측값이 있는 데이터 계산하기
__09-4 판다스 내장 NA 결측값 살펴보기

10 자료형 더 알아보기
__10-1 자료형 살펴보기
__10-2 자료형 변환하기
__10-3 범주형 데이터 알아보기
______ 범주형 데이터 다루기

11 문자열 처리하기
__11-1 문자열 다루기
______ 인덱스로 문자열 추출하기
______ 슬라이싱 구문으로 마지막 문자 추출하기
__11-2 자주 사용하는 문자열 메서드
__11-3 문자열 메서드 더 알아보기
__11-4 문자열 포매팅 알아보기
__11-5 정규식으로 문자열 처리에 날개 달기
______ 정규식이란?
______ compile() 함수
__11-6 regex 라이브러리 활용하기

12 시계열 데이터 알아보기
__12-1 datetime 객체 활용하기
__12-2 datetime으로 변환하기
__12-3 시계열 데이터 불러오기
__12-4 시간 정보 추출하기
__12-5 시간 간격 계산하기
__12-6 datetime 객체의 메서드 활용하기
__12-7 주식 데이터 다루기
__12-8 시간별 데이터 추출하기
__12-9 시간 범위 다루기
______ 시간 범위의 주기 설정하기
__12-10 열 방향으로 값 옮기기
__12-11 시간 주기 변경하기
__12-12 시간대 다루기
__12-13 시계열 데이터 다루는 방법 더 알아보기

찾아보기

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 1800-7327
교환/반품주소
  • 경기도 파주시 문발로 211 1층 / (주)북채널 / 전화 : 1800-7327
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.