1장 빅 데이터의 최근 동향
빅 데이터란 무엇인가? 14
빅 데이터는 어떤 모습인가? 16
실제 응용 23
아파치 하둡이란 무엇인가? 27
하둡의 핵심: MapReduce 28
하둡을 받치는 기둥: HDFS, MapReduce 29
프로그래밍 능력의 향상: Pig, Hive 29
데이터 액세스 향상하기: HBase, Sqoop, Flume 31
조정과 워크플로: Zookeeper, Oozie 33
관리 및 배포: Ambari, Whirr 33
기계 학습: Mahout 34
하둡 사용하기 34
빅 데이터가 큰 이유는 무엇인가 ; 디지털 신경계 35
외골격에서 신경계까지 35
변화의 로드맵 37
다가오는 디지털 신경계, 그 준비는? 39
2장 빅 데이터의 도구, 기법, 전략
대단한 데이터 제품 디자인하기 42
목표 기반 데이터 제품 43
모델 어셈블리 라인: 의사결정 최적화 사례 45
추천 시스템의 드라이브트레인 접근법 52
평생 고객 가치 최적화하기 56
물리적 데이터 제품의 베스트 프랙티스 59
데이터 제품의 미래 65
대단한 기계 학습 제품을 만들려면 무엇이 필요한가 67
기계 학습의 발전 추이 68
흥미로운 문제는 손만 뻗는다고 해서 잡히는 것이 아니다 70
문제 정의하기 72
3장 빅 데이터의 응용
스프레드시트에 얽힌 이야기 76
대시보드에 관한 단상 79
전체 인터뷰 79
천문학 문헌 마이닝하기 80
로버트 심프슨과의 인터뷰: 프로젝트의 배경과 앞으로의 과제 86
틈새 과학 90
데이터의 어두운 면 91
디지털 출판 93
개인 정보 보호 95
4장 빅 데이터에서 주시해야 할 것들
빅 데이터는 우리 세대의 인권 문제: 그러나 우린 그런 줄도 모르고 있다 100
빅 데이터의 세 가지 종류 107
기업 BI 2.0 108
토목공학 110
고객 관계 최적화 112
곤두박질 114
자동화 과학, 딥 데이터, 정보의 역설 114
(반)자동화 과학 115
딥 데이터 119
정보의 역설 122
빅 데이터 솔루션의 난제 126
시각화 비평의 균형 잡기 130
시각화 생태계 131
니즈의 비합리: 패스트푸드와 근사한 저녁 식사 사이 133
비평의 성장 137
최종 생각 141
5장 빅 데이터와 의료 서비스
의료 서비스 분야의 워너메이커 문제 해결하기 144
한층 효율적인 의료 산업을 위해 148
더 많은 데이터, 더 많은 데이터 소스 153
치료 결과에 비용 지급하기 155
데이터를 사용 가능하게 하기 158
우리가 원하는 의료 시스템 구축하기 163
파자드 모스타샤리 박사의 e환자를 위한 건강 정보 인프라 구축 165
존 윌뱅크스, 건강 데이터 공용체의 리스크와 보상에 대해 논하다 171
에스더 다이슨이 바라본 건강 데이터, ‘선점하는 의료 서비스’와 차세대 신성장 동력 182
데이터와 케어 제공자의 결합은 아툴 가완데 박사에게 의료 분야의 희망이다 192
의료 서비스 제공자가 듣지 말아야 할 의료 개혁의 5대 요소 204
추천 자료 212