장바구니 담기 close

장바구니에 상품을 담았습니다.

파이썬 머신러닝 판다스 데이터 분석 (개정판)

파이썬 머신러닝 판다스 데이터 분석 (개정판)

  • 오승환
  • |
  • 정보문화사
  • |
  • 2024-06-25 출간
  • |
  • 584페이지
  • |
  • 187 X 235mm
  • |
  • ISBN 9788956749808
판매가

30,000원

즉시할인가

27,000

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
27,000

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평

예제 중심으로 실무용 데이터 분석을 바로 배우자!

복잡한 이론이 아닌, 풍부한 예제로 비전공자와 입문자의 마음을 사로잡은 강의가 개정판으로 돌아왔다. 최신 버전인 Pandas 2.0 버전에서 추가되거나 변경된 내용을 포함하여 시계열 데이터 처리 등의 기법과 사례 등을 더해 150쪽 이상의 분량이 더해졌다. 특히 시계열 데이터의 효율적인 처리와 분석을 위한 다양한 기법을 추가했다. 시계열 데이터는 시간의 흐름에 따른 연속적인 값으로, 미래를 예측하고 그에 맞는 전략을 세우는 데 큰 도움이 되기 때문에 주식, 환율 등 금융 데이터에 특히 많이 쓰인다. 데이터 분석에서 중요한 부분이기 때문에 다른 자료형을 시계열 객체로 변환하는 것부터 시계열 데이터 처리 기법까지 사례를 대폭 추가해 시간에 따른 데이터 변화를 효과적으로 분석할 수 있도록 했다. 또한 시계열 데이터 처리 강화와 더불어, 데이터 전처리 기법을 더욱 다양화했다. 데이터 정제, 변환, 통합 등 다양한 데이터 전처리 기법을 추가하여 데이터 분석의 기초를 더욱 탄탄히 다질 수 있도록 했다. 데이터의 시각적 표현을 위한 다양한 기법과 도구 역시 새롭게 포함했으며, 데이터 시각화 개선으로 복잡한 데이터를 직관적으로 이해하고 전달하는 기법을 더욱 쉽게 배울 수 있다. 그리고 이 모든 과정을 실습 중심으로 진행한다. 지루하고 복잡한 이론은 최소화하고, 실무에 바로 적용할 수 있는 실습 예제를 풍부하게 담았다. 파이썬 소개와 기초 문법에 대한 설명을 생략하고 예제의 수를 늘렸기 때문에 파이썬 리스트, 딕셔너리 등의 자료구조와 반복문, 조건문 등의 기본 문법을 알고 있는 독자라면 이 책 한 권으로 정확하고 빠르게 실력을 향상시킬 수 있다. 책 속 예제 코드를 하나씩 실행하다 보면 파이썬 데이터 분석과 자연스럽게 가까워질 수 있을 것이다. 이 책을 통해, 데이터를 수집하고 분석하는 일을 즐기게 될 여러분을 환영한다.

목차

PART 1. 판다스 입문
1. 데이터과학자가 판다스를 배우는 이유
2. 판다스 자료구조
2-1. 시리즈
2-2. 데이터프레임
3. 인덱스 활용
4. 산술연산
4-1. 시리즈 연산
4-2. 데이터프레임 연산
5. 필터링
5-1. 불린 인덱싱
5-2. query( ) 메소드 활용
5-3. isin( ) 메소드 활용
6. 텍스트 처리
6-1. 텍스트 저장
6-2. 문자열 메소드(string methods)

PART 2. 데이터 입출력
1. 외부 파일 읽어오기
1-1. CSV 파일
1-2. Excel 파일
1-3. JSON 파일
2. 웹(web)에서 가져오기
2-1. HTML 웹 페이지에서 표 속성 가져오기
2-2. 웹 스크래핑
3. API 활용하여 데이터 수집하기 (1)
4. API 활용하여 데이터 수집하기 (2)
5. 데이터 저장하기
5-1. CSV 파일로 저장
5-2. JSON 파일로 저장
5-3. Excel 파일로 저장
5-4. 여러 개의 데이터프레임을 하나의 Excel 파일로 저장

PART 3. 데이터 살펴보기
1. 데이터프레임의 구조
1-1. 데이터 내용 미리보기
1-2. 데이터 요약 정보 확인하기
1-3. 데이터 개수 확인

2. 통계 함수 적용
2-1. 평균값
2-2. 중앙값
2-3. 최댓값
2-4. 최솟값
2-5. 표준편차
2-6. 상관계수
3. 판다스 내장 그래프 도구 활용

PART 4. 시각화 도구
1. Matplotlib - 기본 그래프 도구
1-1. 선 그래프
1-2. 면적 그래프
1-3. 막대 그래프
1-4. 히스토그램
1-5. 산점도
1-6. 파이 차트
1-7. 박스 플롯
2. Seaborn 라이브러리 - 고급 그래프 도구
3. Folium 라이브러리 - 지도 활용

PART 5. 데이터 사전 처리
1. 누락 데이터 처리
2. 중복 데이터 처리
3. 데이터 정규화
3-1. 단위 환산
3-2. 자료형 변환
4. 범주형(카테고리) 데이터 처리
4-1. 구간 분할
4-2. 더미 변수
5. 피처 스케일링
6. 시계열 데이터
6-1. 다른 자료형을 시계열 객체로 변환
6-2. 시계열 데이터 만들기
6-3. 시계열 데이터 활용
6-4. 시계열 데이터 시각화

PART 6. 데이터프레임의 다양한 응용
1. 함수 매핑
1-1. 개별 원소에 함수 매핑
1-2. 시리즈 객체에 함수 매핑
1-3. 데이터프레임 객체에 함수 매핑
2. 열 재구성
2-1. 열 순서 변경
2-2. 열 분리
3. 그룹 연산
3-1. 그룹 객체 만들기(분할 단계)
3-2. 그룹 연산 메소드(적용-결합 단계)
4. 멀티 인덱스
5. 데이터프레임 합치기
5-1. 데이터프레임 연결
5-2. 데이터프레임 병합
5-3. 데이터프레임 조인
6. 피벗 테이블
7. 스택(stack)
8. 멜트(melt)


PART 7. 머신러닝 데이터 분석
1. 머신러닝 개요
1-1. 머신러닝이란?
1-2. 지도 학습 vs 비지도 학습
1-3. 머신러닝 프로세스
2. 회귀분석
2-1. 단순회귀분석
2-2. 다항회귀분석
2-3. 다중회귀분석
3. 분류
3-1. KNN
3-2. SVM
3-3. Decision Tree
4. 군집
4-1. k-Means
4-2. DBSCAN

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 1800-7327
교환/반품주소
  • 경기도 파주시 문발로 211 1층 / (주)북채널 / 전화 : 1800-7327
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.