대규모 데이터 처리와 분석을 위한 분산 머신러닝 실무 가이드
이 책은 분산 시스템에서 머신러닝을 구현하고 최적화하는 데 필요한 14가지 핵심 패턴과 모범 사례를 소개하는 실무 지침서다. 복잡한 분산 머신러닝 개념을 쉽게 이해할 수 있도록 설명하고, 실무에서 바로 적용할 수 있는 실질적인 방법론을 제시한다. 데이터 분산 처리, 모델 학습의 병렬화, 효율적인 리소스 관리 등 분산 머신러닝의 전반적인 과정에서 발생할 수 있는 다양한 문제를 해결하기 위한 체계적인 패턴을 소개한다. 이를 통해 AI와 데이터 과학 분야의 전문가들뿐만 아니라, 대규모 데이터 처리 및 분석을 다루는 모든 이에게 실용적인 가이드가 될 것이다.
주요 내용
● 데이터 수집, 분산 학습, 모델 서빙 등 다양한 단계로 구성된 ML 파이프라인 구축
● 쿠버네티스, 텐서플로, 쿠브플로, 아르고 워크플로를 사용해 ML 작업 자동화
● 다양한 패턴과 접근 방식 간의 트레이드오프 평가
● 대규모 머신러닝 작업 관리 및 모니터링