장바구니 담기 close

장바구니에 상품을 담았습니다.

빅데이터 분석과 R 활용

빅데이터 분석과 R 활용

  • 윤철호
  • |
  • 생능
  • |
  • 2021-06-30 출간
  • |
  • 460페이지
  • |
  • 190 X 240 mm
  • |
  • ISBN 9791186689363
판매가

28,000원

즉시할인가

27,720

배송비

2,500원

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
27,720

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평




이 책의 구성 및 내용

본 책 〈빅데이터 분석과 R 활용〉은 빅데이터 분석에 대한 포괄적인 이해와 실무 역량을 제공하기 위하여 빅데이터와 R에 대한 소개와 빅데이터 분석 기법들인 정형 데이터 분석, 비정형 데이터 분석, 데이터 시각화 기법에 대한 4부 13장으로 구성되어 있다.

제1부는 ‘빅데이터와 R’ 소개 부분으로 빅데이터의 전반적인 소개와 R 기초 및 프로그래밍을 다루고 있다. 제2부는 ‘정형 데이터 분석’ 부분으로 데이터 기술통계, 데이터 추론통계 그리고 데이터마이닝 분석을 다루고 있다. 제3부는 ‘비정형 데이터 분석’ 부분으로 텍스트마이닝, 오피니언마이닝 그리고 소셜네트워크 분석을 다루고 있다. 마지막 제4부는 ‘데이터 시각화’ 부분으로 다양한 고급 시각화 분석 기법들을 다루고 있다.

1장. 빅데이터
빅데이터에 대한 전반적인 소개 부분으로 빅데이터의 정의, 특징 및 종류와 빅데이터 분석을 위한 기반 기술들을 소개하고 있다. 또한 빅데이터 분석에서의 R과 파이썬의 기능상의 비교도 다루고 있다.

2장. R 기초
R 활용을 위한 기초 부분으로 R의 설치 및 운영환경 설정 그리고 R 기초 사용을 위한 수치계산 기능, 변수 그리고 자료구조에 대하여 다루고 있다.

3장. R 프로그래밍과 그래프
R 프로그래밍과 그래프 작성 방법에 대한 부분으로 R 프로그래밍 개념과 산술ㆍ비교ㆍ논리 연산, 조건ㆍ반복문, 사용자 정의 함수 그리고 기본적으로 제공되는 다양하고 기초적인 R 그래프 작성 방법에 대하여 다루고 있다.

4장. R 자료관리 및 수집
R 자료관리 및 R을 이용한 빅데이터 자료 수집에 대한 부분으로 외부 데이터 불러오기, 데이터 탐색, 데이터 분리 및 병합과 같은 자료관리와 파일 데이터 셋, 웹 스크래핑(web scraping) 및 오픈 API를 이용하여 빅데이터를 수집하는 방법들에 대하여 다루고 있다.

5장. 데이터 기술통계
R을 활용하여 정형 데이터에 대한 기술통계 분석에 대한 부분으로 전통적인 기술통계 기법인 빈도분석, 기술 분석, 교차분석, 다차원 척도법과 최근 빅데이터에 대한 효과적인 기술 분석을 위하여 활용되고 있는 그룹 분석과 탐색적 자료 분석 도구들에 대하여 다루고 있다.

6장. 데이터 추론통계
R을 활용하여 정형 데이터에 대한 추론통계 분석에 대한 부분으로 평균 차이 분석, 비율 차이 분석, 분산분석과 변수 간의 관계성에 초점을 맞추고 있는 상관관계 분석, 회귀분석 방법에 대하여 다루고 있다.

7장. 데이터마이닝(Ⅰ)
R을 활용하여 정형 데이터에 대한 데이터마이닝의 소개 및 분류 분석(classification) 대한 부분으로 데이터마이닝에 대한 전반적인 소개와 주요 데이터마이닝 기법인 단순 베이즈 분석, K-최근접 이웃, 서포트 벡터 머신, 의사결정나무 및 신경망을 이용하여 분류 분석을 수행하는 방법에 대하여 다루고 있다.

8장. 데이터마이닝(Ⅱ)
R을 활용하여 정형 데이터에 대한 예측 분석, 연관 분석, 군집 분석에 대한 부분으로 의사결정나무와 신경망을 이용한 예측 분석 방법과 장바구니 분석으로 잘 알려진 연관 분석, 그리고 군집 분석 기법들인 계층적인 군집 분석과 K-평균 군집 분석을 수행하는 방법에 대하여 다루고 있다.

9장. 텍스트마이닝
R을 활용하여 비정형 데이터 분석인 텍스트마이닝에 대한 부분으로 텍스트마이닝 필수 기술인 자연어 처리 기술과 벡터 공간 모델링을 소개하고 주요 텍스트마이닝 기법들인 주제어 분석, 동시 출현 단어 분석, 토픽 모델링 등을 수행하는 방법에 대하여 다루고 있다.

10장. 오피니언마이닝
R을 활용하여 비정형 데이터 분석인 오피니언마이닝에 대한 부분으로 전통적인 감성 사전 기반의 오피니언 마이닝과 기계학습 기반의 오피니언마이닝을 수행하는 방법에 대하여 다루고 있다.

11장. 소셜네트워크 분석
소셜네트워크 분석에 대한 부분으로 R을 활용하여 원-모드 및 투-모드 소셜네트워크 분석하는 방법과 전문 소셜네트워크 분석 도구인 Gephi와 연계하여 소셜네트워크 분석을 수행하는 방법에 대하여 다루고 있다.

12장. 데이터 시각화
데이터의 시각화에 대한 부분으로 데이터 시각화에 대한 주요 개념에 대한 소개와 데이터 시각화를 위하여 R에서 가장 많이 사용되고 있는 ggplot 패키지를 이용하여 다양한 그래프를 작성하는 방법에 대하여 다루고 있다.

13장. 고급 데이터 시각화
R을 활용한 고급 데이터 시각화에 대한 부분으로 다양한 그래픽 패키지를 이용하여 트리 맵, 버블 차트, 체르노프 페이스, 히트 맵 그리고 지도 맵핑과 같은 고급 데이터 시각화 방법에 대하여 다루고 있다. 또한 웹과 연계된 인터랙티브 그래프 작성 방법에 대하여도 다루고 있다.


목차


제1부 빅데이터와 R

Chapter 1 빅데이터
1.1 빅데이터의 정의
1.1.1 빅데이터란?
1.1.2 빅데이터 특징
1.1.3 빅데이터 종류
1.2 빅데이터 분석기술
1.2.1 빅데이터 분석 기법
1.2.2 빅데이터 분석 인프라 기술
1.3 빅데이터 분석과 R
1.3.1 R 개요
1.3.2 R의 탄생 및 발전 과정
1.3.3 R의 특징
1.3.4 R의 활용
1.3.5 빅데이터 분석에서 R과 파이썬의 비교
연습문제

Chapter 2 R 기초
2.1 R 설치 및 실행
2.1.1 윈도우 버전 R 설치 파일
2.1.2 R 실행
2.1.3 R 사용자 인터페이스
2.1.4 Rtools 소프트웨어 설치
2.2 R 운영환경 구성
2.2.1 R 운영환경 설정
2.2.2 R 패키지 설치 및 사용
2.2.3 빅데이터 분석을 위한 주요 R 패키지
2.3 R 기초
2.3.1 수치계산 기능
2.3.2 변수의 할당
2.3.3 데이터의 유형
2.3.4 함수
2.3.5 자료구조
연습문제

Chapter 3 R 프로그래밍과 그래프
3.1 R 프로그래밍
3.1.1 R 프로그래밍 개념
3.1.2 산술·비교·논리 연산
3.1.3 조건·반복문
3.1.4 R 사용자 정의 함수
3.2 R 그래프
3.2.1 R 그래프 개요
3.2.2 그래프 함수
3.2.3 기본 그래프 작성
3.2.4 그래프의 저장
연습문제

Chapter 4 R 자료관리 및 수집
4.1 R 자료관리
4.1.1 R 데이터 생성하기
4.1.2 외부 데이터 불러오기
4.1.3 데이터 탐색
4.1.4 데이터 관리
4.1.5 데이터 외부로 내보내기
4.1.6 R 내장 데이터 사용하기
4.2 빅데이터 자료수집
4.2.1 빅데이터 제공 기관
4.2.2 파일 데이터 셋 자료수집
4.2.3 웹 스크래핑 자료수집
4.2.4 오픈 API 기반 자료수집
연습문제

제2부 정형 데이터 분석

Chapter 5 데이터 기술통계
5.1 기술통계 개요
5.1.1 주요 기술통계 기법
5.1.2 통계 자료의 종류
5.2 빈도분석
5.2.1 빈도분석 예시
5.2.2 빈도분석 실행
5.3 기술 분석
5.3.1 기술 분석 예시
5.3.2 기술 분석 실행
5.4 교차분석
5.4.1 교차분석 예시
5.4.2 교차분석 실행
5.5 다차원 척도법
5.5.1 다차원 척도법 예시
5.5.2 다차원 척도법 실행
5.6 그룹 분석
5.6.1 그룹 분석 예시
5.6.2 그룹 분석 실행
5.7 탐색적 데이터 분석 도구
5.7.1 박스 플롯
5.7.2 산포도
5.7.3 줄기 잎 도표
5.7.4 Q-Q 도표
연습문제

Chapter 6 데이터 추론통계
6.1 추론통계 개요
6.1.1 주요 추론통계 분석 기법
6.1.2 추론통계의 통계적 추정 및 가설검정
6.2 평균 차이 분석
6.2.1 평균 차이 분석 예시
6.2.2 독립 표본 평균 차이 분석 실행
6.2.3 대응 표본 평균 차이 분석 실행
6.3 비율 차이 분석
6.3.1 비율 차이 분석 예시
6.3.2 비율 차이 분석 실행
6.4 분산분석
6.4.1 분산분석 예시
6.4.2 일원 배치 분산분석 실행
6.4.3 반복측정 분산분석 실행
6.5 상관관계 분석
6.5.1 상관관계 분석 예시
6.5.2 상관관계 분석 실행
6.6 회귀분석
6.6.1 회귀분석 예시
6.6.2 회귀분석 실행
연습문제

Chapter 7 데이터마이닝(Ⅰ)
7.1 데이터마이닝 개요
7.1.1 데이터마이닝 과정
7.1.2 데이터마이닝 분석 유형
7.1.3 데이터마이닝 주요 기법
7.1.4 기계학습과 데이터마이닝
7.1.5 데이터마이닝 활용
7.2 분류 분석
7.2.1 분류 분석의 개요
7.2.2 분류 분석의 절차
7.2.3 분류 분석을 위한 예시 데이터
7.2.4 단순 베이즈 분류
7.2.5 K-최근접 이웃 분석
7.2.6 서포트 벡터 머신
7.2.7 의사결정나무 분석
7.2.8 신경망 분석
7.2.9 비정규 자료 분류 분석
연습문제

Chapter 8 데이터마이닝(Ⅱ)
8.1 예측 분석
8.1.1 예측 분석의 개요
8.1.2 연속형 변수의 예측 분석의 절차
8.1.3 연속형 변수의 예측 분석을 위한 예시 데이터
8.1.4 연속형 변수 예측 의사결정나무 분석
8.1.5 연속형 예측 신경망 분석
8.1.6 이항형 변수의 예측 분석의 절차
8.1.7 이항형 예측 분석을 위한 예시 데이터
8.1.8 이항형 예측 의사결정나무 분석
8.2 연관 분석
8.2.1 연관 분석의 개요
8.2.2 연관 분석의 절차
8.2.3 연관 분석의 예시
8.2.4 연관 분석의 실행
8.3 군집 분석
8.3.1 군집 분석의 개요
8.3.2 계층적 군집 분석
8.3.3 K-평균 군집 분석
연습문제

제3부 비정형 데이터 분석

Chapter 9 텍스트마이닝
9.1 텍스트마이닝 개요
9.1.1 텍스트마이닝 과정
9.1.2 텍스트마이닝 기법
9.1.3 텍스트마이닝 주요 기술
9.2 주제어 분석
9.2.1 주제어 분석 개요
9.2.2 주제어 분석 절차
9.2.3 주제어 분석 예시 데이터
9.2.4 주제어 분석 실행
9.3 동시 출현 단어 분석
9.3.1 동시 출현 단어 분석 개요
9.3.2 동시 출현 단어 분석 절차
9.3.3 동시 출현 단어 분석 예시 데이터
9.3.4 동시 출현 단어 분석 실행
9.4 토픽 모델링
9.4.1 토픽 모델링 개요
9.4.2 토픽 모델링 절차
9.4.3 토픽 모델링 예시 데이터
9.4.4 토픽 모델링 실행
연습문제

Chapter 10 오피니언마이닝
10.1 오피니언마이닝
10.1.1 오피니언마이닝 개요
10.1.2 오피니언마이닝 과정
10.2 감성 분석
10.2.1 감성 분석의 개요
10.2.2 감성 사전
10.2.3 감성 분석의 절차
10.2.4 감성 분석 예시 데이터
10.2.5 감성 분석 실행
10.3 기계학습 기반 감성 분석
10.3.1 기계학습 기반 감성 분석의 개요
10.3.2 기계학습 기반의 감성 분석의 절차
10.3.3 기계학습 기반의 감성 분석 예시 데이터
10.3.4 기계학습 기반의 감성 분석 실행
연습문제

Chapter 11 소셜네트워크 분석
11.1 소셜네트워크 분석 개요
11.1.1 소셜네트워크 분석 과정
11.1.2 네트워크 분석
11.1.3 네트워크 분석 지표
11.1.4 소셜네트워크 분석 기법
11.2 원-모드 소셜네트워크 분석
11.2.1 원-모드 소셜네트워크 분석 개요
11.2.2 원-모드 소셜네트워크 분석 실행 절차
11.2.3 원-모드 소셜네트워크 예시 데이터
11.2.4 원-모드 소셜네트워크 분석 실행
11.2.5 소셜네트워크 시각화 분석 전용 프로그램 활용
11.3 투-모드 소셜네트워크 분석
11.3.1 투-모드 소셜네트워크 분석 개요
11.3.2 투-모드 소셜네트워크 분석 실행 절차
11.3.3 투-모드 소셜네트워크 예시 데이터
11.3.4 투-모드 소셜네트워크 분석 실행
연습문제

제4부 데이터 시각화

Chapter 12 데이터 시각화
12.1 데이터 시각화
12.1.1 데이터 시각화 개요
12.1.2 데이터 시각화 유형
12.2 빅데이터 시각화 기술
12.2.1 시간 시각화
12.2.2 분포 시각화
12.2.3 관계 시각화
12.2.4 비교 시각화
12.2.5 공간 시각화
12.3 R 데이터 시각화 분석
12.3.1 ggplot2 패키지
12.3.2 ggplot2 패키지를 이용하는 시각화
연습문제

Chapter 13 고급 데이터 시각화
13.1 R 고급 시각화 분석
13.1.1 다양한 그래픽 패키지를 이용하는 시각화
13.1.2 인터랙티브 그래프
13.2 R 지도 맵핑 시각화
13.2.1 R에서의 지도 맵핑 시각화 방법
13.2.2 SHP 파일을 이용한 지도 맵핑
13.2.3 구글맵을 이용한 지도 맵핑
연습문제

부록 datasets 패키지의 데이터 셋

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 1800-7327
교환/반품주소
  • 경기도 파주시 문발로 211 1층 / (주)북채널 / 전화 : 1800-7327
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.