장바구니 담기 close

장바구니에 상품을 담았습니다.

데이터 플랫폼 설계와 구축

데이터 플랫폼 설계와 구축

  • 다닐즈부리브스키 ,린다파트너
  • |
  • 에이콘출판
  • |
  • 2022-04-15 출간
  • |
  • 448페이지
  • |
  • 188 X 235 X 25 mm
  • |
  • ISBN 9791161756370
판매가

40,000원

즉시할인가

36,000

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
36,000

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평




◈ 이 책에서 다루는 내용 ◈

◆ 정형 및 비정형 데이터 세트에 대한 모범 사례
◆ 클라우드 기반 머신러닝 툴
◆ 메타데이터와 실시간 분석
◆ 디펜시브 아키텍처, 액세스, 보안

◈ 이 책의 대상 독자 ◈

데이터 플랫폼이 무엇인지, 클라우드의 장점을 활용한 데이터 플랫폼 설계란 무엇인지 궁금한 독자들을 위한 책이다. 데이터 플랫폼 솔루션을 설계할 때 참고할 수 있는 내용을 상세히 다루고 있으며 기술과 비즈니스 간의 연관성을 기반으로 설명했기에 데이터 분석가, 비즈니스 분석가, 프로덕트 오너와 같이 아키텍처, 솔루션 설계를 직접 수행하지 않더라도 솔루션 개념과 원리를 이해할 수 있다. 스트리밍 방식과 배치 방식, 스키마 관리, 기타 주요 디자인 요소 등과 같은 주제를 설계 관점에서 주로 서술한다.

◈ 이 책의 구성 ◈

1장, "데이터 플랫폼 소개"에서는 클라우드 데이터 플랫폼의 개념부터 시작해 데이터 플랫폼이 필요하게 된 배경과 동향을 간단히 설명한다. 클라우드 데이터 플랫폼 설계 시 필요한 핵심 구성 요소를 설명한다.
2장, "데이터 웨어하우스만이 아닌 데이터 플랫폼인 이유"에서는 클라우드 데이터 플랫폼과 클라우드 데이터 웨어하우스의 차이점을 비교한다.
3장, "빅 3의 활용과 확대: 아마존, 마이크로소프트 애저, 구글"에서는 개념적 플랫폼 아키텍처를 좀 더 설명한 후, AWS, 애저, 구글 클라우드 플랫폼에서 제공하는 서비스와 툴이 이 아키텍처의 각 레이어와 어떻게 매핑되는지 설명한다.
4장, "플랫폼으로 데이터 가져오기"에서는 데이터 플랫폼으로 데이터를 수집하는 방식을 집중해서 다룬다. 관계형 데이터베이스, 파일, 스트리밍, SaaS 시스템의 API 활용 등을 설명한다.
5장, "데이터의 구성과 처리"에서는 데이터 플랫폼에서 데이터를 가장 잘 구조화해서 처리하는 방법을 설명하고, 설정 방식 파이프라인과 데이터 처리 단계의 일반적인 개념을 소개한다.
6장, "실시간 데이터 처리 및 분석"에서는 실시간 데이터 처리와 분석, 실시간 수집과 실시간 처리의 차이, 실시간 데이터의 구성 방법과 변환 방법을 설명한다.
7장, "메타데이터 계층 아키텍처"에서는 메타데이터 계층의 기술적 개념과 이것이 필요한 이유를 설명하고, 기술 메타 데이터 모델의 옵션, 구축 옵션, 현재 시장에 출시된 몇 가지 상용 솔루션과 오픈소스 솔루션을 간단히 소개한다.
8장, "스키마 관리"에서는 스키마 관리 관련 개선 필요 사항들을 알아보고, 접근해볼 수 있는 개선 방식을 몇 가지 알려준다. 그리고 스키마 진화를 모던 데이터 플랫폼에서는 어떻게 대응해야 하는지를 설명한다.
9장, "데이터 액세스 방법과 보안"에서는 데이터 소비자의 다양한 유형과 데이터 액세스 포인트를 설명한다. 데이터 웨어하우스, 애플리케이션 액세스, 머신러닝 사용자, BI와 리포팅 툴 등이다.
10장, "비즈니스 가치 제고를 위한 데이터 플랫폼 활용"에서는 비즈니스 가치를 창출하기 위한 데이터 플랫폼 활용 방법을 설명하고 데이터 플랫폼 프로젝트의 성공을 위해 다뤄야 할 문제점을 논의한다.

**
◈ 옮긴이의 말 ◈

이 책의 저자들은 업계 실무 경험과 사업 경험을 겸비하고 있어 이론적 내용보다 실무적인 경험을 기반으로 한 지식 위주로 알려준다. 이 책은 우리 사회와 기업의 화두인 디지털 전환이라는 말을 한 번도 사용하지 않는다. 그런데 이 책을 디지털 전환의 실행력 확보 관점에서 읽으면 클라우드, 애자일, 데이터 영역에서의 기술과 구축 역량과 사례들을 보여주고 있다는 것을 알게 된다. 즉 클라우드의 적극적인 활용, 다양한 데이터 분석 기술 활용, 새로운 필요 역할 식별과 수행, 이를 통한 혁신 프로젝트 추진 내용 사례 등을 담고 있다.
제목을 통해 짐작할 수 있듯이, 클라우드 기반의 데이터 플랫폼 구축 현안을 조금 구체적으로 다루고 있기 때문에 클라우드, 데이터, 분석, 기술, 아키텍처, 구축/운영 프로젝트에 조금이라도 관심이 있는 분들에게 일독을 권한다.
박종하

우리는 IT 기술을 익히기 위해 인터넷에서 많은 정보를 다양한 형태로 얻을 수 있습니다. 그런데도 왜 책이라는 매개체로 IT 기술을 이해하려 할까요? 아마도 대부분의 IT 서적에는 현대의 특정 기술을 중심으로 저자의 경험과 생각이 체계적으로 정리돼 있으며, 이를 통해 단편적 기술이나 지식이 아닌 저자의 통찰력과 경험적 내용을 참고하고 싶기 때문일 것입니다.
이 책은 현대의 데이터 플랫폼의 구조를 저자의 경험 관점에서 다루고 있습니다. 데이터에 대한 기본적 지식을 필요로 하거나 기초를 다지기 위한 용도라면 적합하지 않습니다. 또한 실습 과정도 담고 있지 않습니다. 대신 논리적인 사고를 통해, 책을 읽으며 의식의 흐름대로 플랫폼을 상상하면서 이해하는 과정을 요구합니다. 실무에서 데이터를 다루고 있거나 과거에 데이터를 충분히 다뤄본 사람이라면 현대의 데이터 플랫폼이 어떤 기능과 구조를 갖는지, 그리고 자신의 경험과 현재 다루고 있는 데이터 플랫폼이 책에서 제시하는 아키텍처와 비교해 어떤 수준을 가지며 어떤 차이점이 있는지 참고하며 바람직한 방향으로 발전하기를 고민할 때 본 책이 의미가 있겠습니다. 또한 데이터 플랫폼을 설계할 계획이 있는 아키텍트라면 한 번은 꼭 읽기를 권합니다. 선진 사례를 참고해 반드시 고민해야 할 문제를 놓치지 않고 설계에 반영할 수 있기 때문입니다.
클라우드 환경이 보편화되고 기술이 발전하면서 데이터의 수집과 처리, 분석, 리포트 등 대량의 데이터를 처리하는 방식이 비약적으로 발전해오고 있습니다. 클라우드 서비스의 여러 사례는 현재도 계속 업데이트되기 때문에 출간 시의 시점과는 다를 수 있겠지만 기본적인 방향과 특성은 지속적으로 참조할 만합니다.
다시 말씀드리면 이 책은 중급 이상의 내용을 다루고 있으며 충분한 기술적 경험이 없다면 이해하기 어려운 부분도 있을 것입니다. 이런 부분은 실질적으로 데이터를 다루면서 경험해봐야 이해할 수 있을 것입니다. 이 책이 독자들이 식견, 견해를 넓히고 새로운 아이디어를 창출하는 기반이 되기를 바랍니다.
최철원, 구본아


목차


1장. 데이터 플랫폼 소개
1.1 데이터 웨어하우스에서 데이터 플랫폼으로의 이동과 관련된 동향들
1.2 데이터의 속도, 규모, 다양성이 증가하는 상황에서 데이터 웨어하우스의 한계
1.2.1 데이터의 다양성
1.2.2 데이터 규모
1.2.3 데이터 속도
1.2.4 세 가지 V
1.3 데이터 레이크가 대안이 될 수 있을까?
1.4 퍼블릭 클라우드 활용
1.5 클라우드, 데이터 레이크, 데이터 웨어하우스: 클라우드 데이터 플랫폼의 등장
1.6 클라우드 데이터 플랫폼의 빌딩 블록(building block)
1.6.1 수집 계층
1.6.2 스토리지 계층
1.6.3 처리 계층
1.6.4 서비스 계층
1.7 클라우드 데이터 플랫폼이 세 가지 V를 다루는 방법
1.7.1 데이터의 다양성
1.7.2 데이터 규모
1.7.3 데이터 속도
1.7.4 추가 V 두 가지
1.8 공통 유스 케이스
요약

2장. 데이터 웨어하우스만이 아닌 데이터 플랫폼인 이유
2.1 클라우드 데이터 플랫폼과 클라우드 데이터 웨어하우스: 실용적 측면
2.1.1 데이터 소스 자세히 살펴보기
2.1.2 클라우드 데이터 웨어하우스만 활용한 사례
2.1.3 클라우드 데이터 플랫폼 아키텍처 사례
2.2 데이터 수집
2.2.1 애저 시냅스로 직접 데이터 수집
2.2.2 애저 데이터 플랫폼으로 데이터 수집
2.2.3 업스트림 데이터 소스의 변경 관리
2.3 데이터 처리
2.3.1 웨어하우스에서 데이터 처리
2.3.2 데이터 플랫폼에서 데이터 처리
2.4 데이터 액세스
2.5 클라우드 비용 고려사항
요약
2.6 연습문제 정답

3장. 빅 3의 활용과 확대: 아마존, 마이크로소프트 애저, 구글
3.1 클라우드 데이터 플랫폼 계층 아키텍처
3.1.1 데이터 수집 계층
3.1.2 고속 스토리지와 저속 스토리지
3.1.3 처리 계층
3.1.4 기술 메타데이터 계층(Technical metadata layer)
3.1.5 서비스 계층과 데이터 소비자
3.1.6 오케스트레이션 오버레이와 ETL 오버레이 계층
3.2 데이터 플랫폼 아키텍처에서 계층의 중요성
3.3 클라우드 데이터 플랫폼 계층에 활용할 수 있는 툴 매핑
3.3.1 AWS
3.3.2 구글 클라우드
3.3.3 애저
3.4 상용 소프트웨어 및 오픈소스 대안
3.4.1 배치 데이터 수집
3.4.2 스트리밍 데이터 수집 및 실시간 분석
3.4.3 오케스트레이션 계층
요약
3.5 연습문제 답안

4장. 플랫폼으로 데이터 가져오기
4.1 데이터베이스, 파일, API, 스트림
4.1.1 관계형 데이터베이스(Relational databases)
4.1.2 파일
4.1.3 SaaS API
4.1.4 스트림
4.2 관계형 데이터베이스에서 데이터 수집
4.2.1 SQL 인터페이스를 사용해 RDBMS에서 데이터 수집
4.2.2 테이블 전체 데이터 수집
4.2.3 증분 데이터 수집
4.2.4 변경 데이터 캡처
4.2.5 CDC 공급 업체 개요
4.2.6 데이터 타입 변환(Data type conversion)
4.2.7 NoSQL 데이터베이스에서 데이터 수집
4.2.8 RDBMS 또는 NoSQL 수집 파이프라인용 메타데이터 캡처
4.3 파일에서 데이터 수집
4.3.1 수집된 파일 추적
4.3.2 파일 수집 메타데이터 캡처
4.4 스트림 방식의 데이터 수집
4.4.1 배치와 스트리밍 수집의 차이점
4.4.2 스트리밍 파이프라인의 메타데이터 캡처
4.5 SaaS 애플리케이션들로부터 데이터 수집
4.5.1 API 설계 표준의 부재
4.5.2 전체 데이터나 증분 데이터 내보내기(export) 처리 방법의 표준 부재
4.5.3 일반적으로 결과 데이터는 중첩된 JSON 도큐먼트다
4.6 클라우드 데이터 수집에서 네트워크 및 보안 고려 사항
4.6.1 클라우드 데이터 플랫폼과 타 네트워크 간 연결
요약
4.7 연습문제 답안

5장. 데이터의 구성과 처리
5.1 데이터 플랫폼에서 처리(Processing) 계층을 별도로 분리한다는 것
5.2 데이터 처리 스테이지
5.3 클라우드 스토리지 구성
5.3.1 클라우드 스토리지 컨테이너와 폴더
5.4 공통 데이터 처리 단계
5.4.1 파일 포맷 변환
5.4.2 데이터 중복 제거
5.4.3 데이터 품질 검사
5.5 설정 가능한 파이프라인
요약
5.6 연습문제 정답

6장. 실시간 데이터 처리 및 분석
6.1 실시간 수집 계층과 실시간 처리 계층 비교
6.2 실시간 데이터 처리 유스케이스
6.2.1 소매점(Retail) 유스케이스: 실시간 수집
6.2.2 온라인 게임 유스케이스: 실시간 수집과 실시간 처리
6.2.3 실시간 수집과 실시간 처리의 비교 요약
6.3 실시간 수집과 실시간 처리의 활용 시점
6.4 실시간 사용을 위한 데이터 구조화
6.4.1 고속 스토리지의 구조
6.4.2 고속 스토리지 스케일링 방법
6.4.3 실시간 스토리지에서 데이터 구조화
6.5 실시간 시스템에서 공통 데이터 변환
6.5.1 실시간 시스템에서 데이터 중복의 원인
6.5.2 실시간 시스템에서 데이터 중복 제거
6.5.3 실시간 파이프 라인에서 메시지 포맷 변환
6.5.4 실시간 데이터 품질 체크
6.5.5 배치 데이터와 실시간 데이터 결합하기
6.6 실시간 데이터 처리용 클라우드 서비스의 종류
6.6.1 AWS 실시간 처리 서비스
6.6.2 GCP 실시간 처리 서비스
6.6.3 애저 실시간 처리 서비스
요약
6.7 연습문제 해답

7장. 메타데이터 계층 아키텍처
7.1 메타데이터의 의미
7.1.1 비즈니스 메타데이터
7.1.2 파이프라인 메타데이터(데이터 플랫폼 내부 메타데이터)
7.2 파이프라인 메타데이터의 장점
7.3 메타데이터 모델
7.3.1 메타데이터 도메인
7.4 메타데이터 계층 구현 옵션
7.4.1 설정 파일의 모음인 메타데이터 계층
7.4.2 메타데이터 데이터베이스
7.4.3 메타데이터 API
7.5 기존 솔루션 개요
7.5.1 클라우드 메타데이터 서비스
7.5.2 오픈소스 메타데이터 계층
요약
7.6 연습문제 답안

8장. 스키마 관리
8.1 스키마 관리가 필요한 이유
8.1.1 기존 데이터 웨어하우스 아키텍처의 스키마 변경
8.1.2 스키마 온 리드 방식
8.2 스키마 관리 방식
8.2.1 스키마를 계약으로 다루는 방식
8.2.2 데이터 플랫폼의 스키마 관리
8.2.3 스키마 변경 모니터링
8.3 스키마 레지스트리 구현
8.3.1 아파치 아브로 스키마
8.3.2 스키마 레지스트리 솔루션
8.3.3 메타데이터 계층의 스키마 레지스트리
8.4 스키마 진화 시나리오(Schema evolution scenarios)
8.4.1 스키마 호환성 규칙
8.4.2 스키마 진화와 데이터 변환 파이프라인
8.5 스키마 진화와 데이터 웨어하우스
8.5.1 클라우드 데이터 웨어하우스의 스키마 관리 기능
요약
8.6 연습문제 답

9장. 데이터 액세스 방법과 보안
9.1 데이터 소비자 유형
9.2 클라우드 데이터 웨어하우스
9.2.1 AWS 레드시프트
9.2.2 애저 시냅스
9.2.3 구글 빅쿼리(Google BigQuery)
9.2.4 적합한 데이터 웨어하우스 선정하기
9.3 애플리케이션 데이터 액세스
9.3.1 클라우드 관계형 데이터베이스
9.3.2 클라우드 키/밸류 데이터 저장소
9.3.3 전문 검색 서비스
9.3.4 인메모리 캐시
9.4 데이터 플랫폼에서의 머신러닝
9.4.1 클라우드 데이터 플랫폼에서의 머신러닝 모델 라이프사이클
9.4.2 ML 클라우드 협업 툴
9.5 비즈니스 인텔리전스와 리포팅 툴(reporting tool)
9.5.1 BI 툴(Business Intelligence tool)과 클라우드 데이터 플랫폼 통합
9.5.2 BI 툴로 엑셀(Excel) 사용하기
9.5.3 클라우드 공급 업체 서비스에 포함돼 있지 않은 BI 툴
9.6 데이터 보안
9.6.1 사용자, 그룹 및 역할
9.6.2 자격 증명 및 설정 관리
9.6.3 데이터 암호화
9.6.4 네트워크 바운더리(boundary)
요약
9.7 연습문제 정답

10장. 비즈니스 가치 제고를 위한 데이터 플랫폼 활용
10.1 데이터 전략이 필요한 이유
10.2 분석 역량 성숙을 위한 여정
10.2.1 SEE: 데이터로부터 인사이트를 얻는 단계
10.2.2 PREDICT: 데이터를 활용해서 예측하는 단계
10.2.3 DO: 분석 결과를 기반으로 액션을 진행하는 단계
10.2.4 CREATE: 분석을 넘어서 제품에 반영하는 단계
10.3 데이터 플랫폼: 분석 역량 성숙을 강화하는 엔진
10.4 플랫폼 프로젝트 장애물들
10.4.1 시간에 대한 인식 차
10.4.2 사용자 확산
10.4.3 사용자로부터의 신뢰성 확보와 데이터 거버넌스
10.4.4 플랫폼 사일로
10.4.5 달러 댄스
요약

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 1800-7327
교환/반품주소
  • 경기도 파주시 문발로 211 1층 / (주)북채널 / 전화 : 1800-7327
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.