◈ 이 책에서 다루는 내용 ◈
◆ 헬스케어와 빅데이터, AI(인공지능) 개론
◆ IPython, 주피터 노트북, VSCode 사용법
◆ 파이썬의 기본 문법
◆ NumPy 라이브러리 사용법
◆ 데이터 분석의 핵심 pandas 라이브러리 사용법
◆ 사례에 기초한 데이터 수집과 전처리
◆ DBMS로부터 분석 대상 데이터를 파일로 추출
◆ 사례에 기초한 시계열 데이터 정제 및 분석, 그룹화, 시각화
◆ 사용자 정의 함수로 데이터 분석 고도화
◆ 자동화를 위한 배치 프로그램 작성 및 크론탭, scheduler 라이브러리 사용법
◆ 간단한 웹 대시보드 제작
◈ 이 책의 대상 독자 ◈
컴퓨터공학 전공자 및 보건 의료 종사자, 카드사, 보험사 직원 등으로, 파이썬을 활용한 빅데이터 분석 경험이 풍부하지 않은 사람을 대상으로 한다. 파이썬 지식이 부족한 독자들도 쉽게 따라올 수 있도록 구성했다.
◆ 파이썬으로 빅데이터를 분석하고 싶은 입문자
◆ 시계열 데이터를 다양한 기법으로 분석, 그룹화, 시각화하기를 원하는 독자
◆ 실제 IT기업에서 빅데이터 분석 및 시각화를 어떻게 구현하는지 궁금한 독자
◆ 상업용 빅데이터 분석과 자동화 시스템 구축, 웹 대시보드를 만들고 싶은 독자
◆ 파이썬의 기초부터 pandas 라이브러리 사용법 레퍼런스가 필요한 독자
◈ 이 책의 구성 ◈
저자가 처음 책을 기획할 때에는 사례 중심으로 책을 구성하고, 파이썬 문법 및 pandas에 대해서는 간략하게 다룰 계획이었다. 그러나 책을 집필작성하는 과정에서 다른 서적의 pandas 내용에 대한 불만족감을 느껴이 생겨, 이 책이 분석 업무를 수행할 수 있는 완결된 가이드가 되도록 NumPy와 pandas를 상세하게 다루게 되었됐다. 다만, matplotlib은는 이번에는 포함하지 않았다. matplotlib의 사용 방법은 어렵지 않아,고 다른 서적이나 인터넷 자료를 참조하면 충분할 것이다.