장바구니 담기 close

장바구니에 상품을 담았습니다.

Hadoop Hacks

Hadoop Hacks

  • 나카노 다케시
  • |
  • 와우북스
  • |
  • 2015-12-09 출간
  • |
  • 528페이지
  • |
  • 190 X 235 mm /982g
  • |
  • ISBN 9788994405261
판매가

31,000원

즉시할인가

27,900

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
27,900

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평

도서 소개
프로페셔널이 사용하는 HADOOP HACKS 74개 실전 테크닉 !

Hadoop의 개요를 이해한 독자를 대상으로 Hadoop을 실제 능숙하게 사용하기 위한 테크닉과 Tips을 정리한 책이다. 시스템 구축/운용, 애플리케이션 개발 등 Hadoop만의 특성을 마스터하는 방법부터 Hbase, Hive, Pig, Mahout, ZooKeeper 등 부제에 관한 Hack까지 광범위한 내용을 담고 있다. Hadoop의 능력을 최대한 이끌어 내는데 필요한 툴과 그 사용법, 그리고 내부 동작을 알기 위한 방법과 더불어 앞선 테크닉 등, 개발현장에서 필요한 74개의 테크닉을 게재했다. 앞서 Hadoop에 주목해 실제로 활용해 온 전문가들이 쓴 이 책은 Hadoop을 능숙하게 사용하고 싶은 엔지니어에게 꼭 필요한 책이다.

도서 특징
1장 『시스템 구축/운용 Hacks』Hadoop을 마스터한 이후에 인프라 기반의 관점에서 중요한 포인트를 정리하고, Hadoop은 패치 처리 구조라서 각각의 처리(JOB)를 정기적으로 하는지, 잘 가동되고 있는지를 담당자가 확인할 필요가 있다. 이런 작업(Job) 관리용 도구에 관해서 소개한다.

2장 『Application 개발 Hacks』Hadoop을 사용한 데이터 처리에서 몇 가지 노하우를 살펴보고, Hadoop에 의한 MapReduce를 직접 사용하지 않고 Hive나 Pig 등을 사용하는 케이스가 증가하는 경우에도 Hadoop에 대한 깊은 이해가 필요하다.

3장 『HBase Hacks』Hadoop에서 동작하는 KVS인 HBase를 알아본다. HBase를 활용하기 위한 노하우 즉, 비교적 사용 빈도가 높은 MySQL과의 연계방법, RDBMS에서 말하는 트리거, 스토어 프로시저에 해당하는 Coprocessor 기능, 그리고 추가로 데이터가 일괄적으로 입력될 때의 케어(pre-split 테이블) 등을 소개한다.

4장 『Hive Hacks』Hadoop을 사용한 빅데이터 활용을 손쉽게 하는 도구 Hive에 관해서 살펴보고, Hive를 활용하는 노하우 즉, 자동 시스템과 연계 진행방법, 높은 성능의 HiveQL 작성방법 등을 소개한다. Hadoop의 등장으로 인해 대규모 데이터 처리를 구현하는 것의 장벽은 낮아졌지만, Hive는 이것을 더욱 간단하게 해준다.

5장 『Pig Hacks』Hadoop을 사용한 빅데이터 활용을 유용하게 해주는 툴 중의 하나인 Pig를 살펴본다. Pig를 활용하고 있는 현장에서 Java에서 Pig를 사용하는 방법이나 Pig에서의 처리가 가벼워지도록 튜닝하기 위해서 어떻게 MapReduce에 변환되는지 확인하는 방법 등을 소개한다.

6장 『Mah out Hacks』기계학습의 도구/라이브러리인 Mahout를 살펴본다. 최소한 알고 있으면 이해에 도움이 되는 기계학습 분야의 단어를 소개하고 몇 가지 기능을 사용해보는 것과 동시에 그 기능이 어떻게 MapReduce에 배포되고 분산 처리되는지 살펴본다.

7장 『ZooKeeper Hacks』Hadoop의 예고 시스템에서 많이 사용되는 ZooKeeper에 관해 알아본다. ZooKeeper를 이용함으로써 간단한 시스템으로 설계할 수 있으므로 꼭 이번 장을 참고하자.

목차

·크레딧
·시작하며

1장 시스템 구축/운용 Hacks
01 Hadoop 동작에 필요한 Parameter
02 Hadoop용 node의 Linux OS 설정
03 Master Node의 HA화
04 Hadoop에 관련된 통계정보
05 HDFS의 업그레이드
06 Sqoop의 구조와 동작
07 PostgreSQL에서의 동작
08 Azkaban 입문
09 Azkaban의 이용

2장 Application 개발 Hacks
10 Cluster 외부로부터 Hadoop의 조작
11 InMapperCombiner
12 사용자 정의 Writable형을 만드는 방법
13 사용자 Partitioner를 만드는 방법
14 DistributedCache의 사용방법
15 CombineFileInputFormat
16 MapReduce 작업 테스트하기
17 보조 정렬(Secondary sort)
18 Map 사이드 조인
19 Reduce 사이드 조인
20 다단 MapReduce
21 InputFormat/OutputFormat의 사용방법
22 Cassandra와의 연계
23 API로 HDFS 조작
24 MapReduce 작업 분석
25 Hadoop에서의 압축 파일 취급

3장 HBase Hacks
26 Bulk 로드 도구
27 MySQL에서 가져오기
28 HFile에 직접 액세스하는 MapReduce
29 pre-split 테이블 만들기
30 Coprocessor 만드는 법
31 사용자 Filter 만드는 법
32 export/import 도구
33 클러스터 복제(Cluster Replication)

4장 Hive Hacks
34 SQL과 HiveQL의 다른 점
35 Hive의 실제 운용에서 관리해야 할 것
36 쿼리의 고속화(입문편)
37 쿼리의 고속화(응용편)
38 사용자 정의 함수
39 다른 시스템과 연계하기
40 자체 처리를 통합하기
41 다중 사용자의 이용
42 인덱스의 사용
43 Hive 로그
44 Sqoop에서 데이터 로드
45 차분 데이터의 교환

5장 Pig Hacks
46 custom storage 작성방법
47 PigLatin과 SQL의 차이
48 사용자 정의 함수
49 Embedded Pig
50 MapReduce로의 변환 분석
51 Pig에서 바로 이용할 수 있는 함수 301

6장 Mahout Hacks
52 Mahout 입문
53 설치와 실행방법
54 기초 용어 배우기
55 추천하기(Recommend)를 실행
56 연계분석
57 예측 모델 만들기
58 기계학습과 MapReduce
59 자체 드라이버 만들기
60 Mahout을 이용한 클러스터링

7장 ZooKeeper Hacks
61 ZooKeeper의 API
62 ZooKeeper의 액세스 제어
63 Eclipse를 사용한 개발
64 ZooInspector 사용
65 REST에서 ZooKeeper 사용
66 FUSE에서 ZooKeeper 사용
67 tickTime 구조 이해하기
68 ZAB의 구조 이해하기
69 리더 선택의 구조 이해하기
70 상태와 역할을 이해하기
71 그룹핑.중가치 이용하기
72 분산 애플리케이션 구축
72 ZooKeeper를 중심으로 한 시스템(BookKeeper)
74 BookKeeper를 사용한 시스템

column 1 Cloudera’s Distribution including Apache Hadoop(CDH)에 대해서
column 2 MapR에 대해서
·찾아 보기

저자소개

저자 나카노 다케시는 1976년 효고켄 출신. 나라 첨단 대학원대학을 거쳐 주식회사 리쿠르트에 입사. 정보시스템 부문의 MIT에서 웹 인프라 구축부터 R25 등의 사이트 제작/개발/운용 등을 담당. 그 기간 Solr 등 OSS의 도입과 Cache, Middleware 개발 등을 추진. twitter: @tf0054

도서소개

『Hadoop Hacks』는 Hadoop의 개요를 이해한 독자를 대상으로 Hadoop을 실제 능숙하게 사용하기 위한 테크닉과 Tips을 정리한 책이다. 시스템 구축/운용, 애플리케이션 개발 등 Hadoop만의 특성을 마스터하는 방법부터 Hbase, Hive, Pig, Mahout, ZooKeeper 등 부제에 관한 Hack까지 광범위한 내용을 담고 있다. Hadoop의 능력을 최대한 이끌어 내는데 필요한 툴과 그 사용법, 그리고 내부 동작을 알기 위한 방법과 더불어 앞선 테크닉 등, 개발현장에서 필요한 74개의 테크닉을 게재했다. 앞서 Hadoop에 주목해 실제로 활용해 온 전문가들이 쓴 이 책은 Hadoop을 능숙하게 사용하고 싶은 엔지니어에게 꼭 필요한 책이다.

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 1800-7327
교환/반품주소
  • 경기도 파주시 문발로 211 1층 / (주)북채널 / 전화 : 1800-7327
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.