장바구니 담기 close

장바구니에 상품을 담았습니다.

파이썬을 이용한 데이터 분석 2/e

파이썬을 이용한 데이터 분석 2/e

  • 아르만도 판당고
  • |
  • 에이콘출판
  • |
  • 2018-01-24 출간
  • |
  • 400페이지
  • |
  • 188 X 235 X 23 mm
  • |
  • ISBN 9791161751078
판매가

30,000원

즉시할인가

27,000

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
27,000

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평

★ 이 책에서 다루는 내용 ★

■ NumPy, SciPy, Pandas, statsmodels, scikit-learn, 떼아노(theano), 케라스(keras), 텐서플로와 같은 오픈소스 파이썬 모듈의 설치
■ 데이터의 준비 및 정제와 탐구 분석을 위한 데이터 활용
■ Pandas로 데이터 다루기
■ RDBMS, NoSQL, 분산 시스템(HDFS, HDF5 등)을 위한 데이터의 검색 및 저장
■ matplotlib, bokeh, plotly와 같은 오픈소스 라이브러리를 이용한 데이터 시각화
■ 지도, 비지도, 확률론적(probabilistic), 베이지안 등의 다양한 머신 러닝 기법 학습
■ 신호 처리와 시계열 데이터 분석의 이해
■ 그래프 처리 및 소셜 미디어 분석

★ 이 책의 대상 독자 ★

이 책은 기본적인 파이썬 지식을 갖췄으며, 파이썬 라이브러리를 이용한 데이터 분석을 배우고자 하는 수학자를 위해 쓰였다. 가능한 한 그 내용을 간단히 다루고자 노력했지만, 모든 주제를 자세히 기술하지 못했다. 수학에 관한 기본적인 내용은 칸 아카데미(Khan Academy)와 코세라(Coursera) 등의 온라인 플랫폼을 이용해 살펴보는 것도 좋을 듯하다.

★ 이 책의 구성 ★

1장. '파이썬 라이브러리로 시작하기'에서는 파이썬과 기본적인 파이썬 데이터 분석 라이브러리를 설치한다. NumPy를 사용해 간단한 애플리케이션을 작성하고 matplolib를 통해 기본적인 그래프를 그려본다.
2장. 'NumPy 배열 다루기'에서는 NumPy와 기본적인 배열을 소개한다. 끝부분에서는 NumPy 배열의 기본을 이해하고 관련된 함수를 살펴본다.
3장. 'Pandas 입문'에서는 Pandas 함수성, 자료 구조, 연산자에 대해 배운다.
4장. '통계학 및 선형 대수'에서는 선형 대수와 통계 함수를 간단히 살펴본다.
5장. '데이터의 검색, 처리, 저장'에서는 다양한 형식 파일에서 데이터를 얻는 방법과 원시 데이터를 정리하고 저장하는 방법을 배운다.
6장. '데이터 시각화'에서는 matplolib와 Pandas 플로팅(plotting) 함수를 사용해 데이터를 그래프화하는 방법을 소개한다.
7장. '신호 처리와 시계열'에서는 흑점 주기 데이터를 사용하는 시계열 및 신호 처리 예제를 살펴본다. 이 예제는 statsmodels와 함께 NumPy/SciPy를 사용한다.
8장. '데이터베이스로 작업하기'에서는 여러 데이터베이스(관계형 및 NoSQL)와 관련 API에 대해 배운다.
9장. '문자 데이터와 소셜 미디어 분석하기'에서는 감성 분석과 주제 인지를 위해 문자를 분석해본다. 주어진 네트워크 분석 예제 또한 살펴본다.
10장. '예측 분석과 머신 러닝'에서는 scikit-learn 라이브러리를 이용해 주어진 예제에서 날씨를 예측하는 인공지능에 대해 알아본다. scikit-learn 라이브러리에서 다루지 않은 알고리즘에 사용되는 다른 API도 사용해본다.
11장. '파이썬 외의 서비스 환경과 클라우드 컴퓨팅'에서는 파이썬으로 작성되지 않은 코드를 통합해 실행하는 방법을 배운다. 클라우드에서 파이썬을 사용하는 부분도 다룬다.
12장. '성능 튜닝, 프로파일링, 그리고 병렬 제어'에서는 키 기술을 통한 프로파일링과 Cython을 이용해 성능을 높여본다. 분산 시스템과 다중 코어에 적합한 프레임워크도 다룬다.

목차

1장. 파이썬 라이브러리로 시작하기
__파이썬 3 설치하기
____데이터 분석 라이브러리 설치하기
____리눅스와 맥 OS X
____윈도우
__셸에서 IPython 사용하기
__매뉴얼 읽어보기
__Jupyter Notebook
__NumPy 배열
__간단한 예제
__도움말 및 참조하기
__파이썬 라이브러리의 모듈 나열하기
__matplotlib로 데이터 시각화하기
__요약

2장. NumPy 배열 다루기
__NumPy 배열 객체
____NumPy 배열의 장점
__다차원 배열 생성
__NumPy 배열 원소 추출하기
__NumPy 숫자형
____자료형 객체
____문자 코드
____dtype 생성자
____dtype 어트리뷰트
__일차원 슬라이싱 및 인덱싱
__배열 형상 다루기
____배열 합치기
____NumPy 배열 쪼개기
____NumPy 배열 어트리뷰트
____배열 변환하기
__배열 뷰를 생성하고 복사하기
__고급 인덱싱
__위치 데이터로 인덱싱하기
__논리형 방식으로 인덱싱하기
__브로드캐스팅
__요약
__참고 자료

3장. Pandas 입문
__Pandas 설치와 둘러보기
__Pandas 데이터프레임
__Pandas 시리즈
__Pandas의 데이터 검색
__Pandas 데이터프레임과 통계학
__Padas 데이터프레임과 데이터 수집
__데이터프레임 연쇄와 추가
__데이터프레임 조인
__누락된 데이터 다루기
__날짜 다루기
__피벗 테이블
__요약
__참고 자료

4장. 통계학및 선형 대수
__NumPy와 기본적인 통계학
__NumPy와 선형 대수학
____NumPy와 역행렬
____NumPy로 선형 시스템 해석하기
__NumPy와 고유 값 및 고유 벡터
__NumPy와 난수
____갬블링과 이항 분포
____정규 분포 샘플링
____SciPy와 정규성 검정
__NumPy와 마스킹된 배열
____음수및 극단적인 값들의 제거
__요약

5장. 데이터 검색과 처리, 저장
__NumPy와 Pandas로 CSV 파일 쓰기 .npy와 피클 포맷
__PyTables와 데이터 저장
__HDF5 형태로 Pandas 데이터프레임 읽기 및 쓰기
__Pandas로 엑셀 파일 읽기 및 쓰기
__REST 웹 서비스 및 JSON
__Pandas와 JSON 읽기 및 쓰기
__RSS 및 Atom 피드 파싱
__Beautiful Soup를 활용한 HTML 파싱
__요약
__참고 자료

6장. 데이터 시각화
__matplotlib 패키지
__기본적인 matplotlib 플롯
__로그 플롯
__분산 플롯
__범례 및 주석 3차원 플롯
__Pandas와 플로팅
__지연 플롯
__자기 상관 플롯
__Plot.ly
__요약

7장. 신호 처리와 시계열
__statsmodels 모듈
__이동 평균법
__윈도우 함수
__공적분
__자기 상관
__자기 회귀 모델
__ARMA 모델
__주기적인 신호 발생하기
__푸리에 분석
__스펙트럼 분석
__필터링
__요약

8장. 데이터베이스로 작업하기
__sqlite3의 개요
__Pandas로 데이터베이스 접근하기
__SQLAlchemy
____SQLAlchemy 설치하고 구성하기
____SQLAlchemy로 데이터베이스 추가하기
____SQLAlchemy로 데이터베이스 쿼리하기
__Pony ORM
__Dataset: 사용하기 쉬운 데이터베이스
__PyMongo와 MongoDB
__Redis에 데이터 저장하기
__memcache에 데이터 저장하기
__Apache Cassandra
__요약

9장. 문자 데이터와 소셜 미디어 분석하기
__NLTK 설치
__NLTK란?
__불용어, 고유 명사, 숫자 걸러내기
__단어 주머니 모델
__단어 빈도수 분석
__나이브 베이즈 분류기
__감성 분석
__워드 클라우드 만들기
__소셜 미디어 분석
__요약

10장. 예측 분석과 머신 러닝
__전처리
__로지스틱 회귀 분석을 이용한 분류
__서포트 벡터 머신을 이용한 분류
__ElasticNetCV를 이용한 회귀 분석
__서포트 벡터 회귀 분석
__친근도 전파를 이용한 클러스터링
__평균 이동
__유전자 알고리즘
__신경망
__결정 트리
__요약

11장. 파이썬 외의 서비스 환경과 클라우드 컴퓨팅
__Matlab/Octave로 정보 주고받기
__rpy2 패키지 설치 R 언어 인터페이스
__자바로 NumPy 배열 넘겨주기
__SWIG와 NumPy 통합하기
__Boost와 파이썬 통합하기
__F2py로 포트란 코드 사용하기
__PythonAnywhere 클라우드
__요약

12장. 성능 튜닝, 프로파일링, 그리고 병렬 제어
__코드 프로파일링
__Cython 설치하기 C 코드 호출하기
__다중 처리로 풀 작업 생성하기
__Joblib에서 병렬 for 반복문을 사용해 속도 높이기
__Bottleneck과 NumPy 함수 비교하기
__Jug로 맵리듀스 실행하기
__파이썬에서 MPI 설치하기
__병렬 IPython
__요약

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 1800-7327
교환/반품주소
  • 경기도 파주시 문발로 211 1층 / (주)북채널 / 전화 : 1800-7327
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.