목차
추천의 글
머리말
감사의 글
지은이 소개
옮긴이 소개
옮긴이의 말
들어가며
1부 무기고 구축하기
1장 이탈의 세상
1.1 이 책을 읽는 이유
1.1.1 일반적인 이탈 시나리오
1.1.2 이 책의 주제
1.2 이탈과의 싸움
1.2.1 이탈을 줄이는 개입
1.2.2 이탈과의 싸움이 어려운 이유
1.2.3 뛰어난 고객 메트릭: 이탈과 싸우기 위한 무기들
1.3 일반적인 데이터 분석 책과의 차별점
1.3.1 실무적이고 상세한 내용
1.3.2 시뮬레이션 사례 연구
1.4 사용자가 반복적으로 상호 작용하는 제품
1.4.1 유료 소비재
1.4.2 B2B 서비스
1.4.3 광고 기반 미디어와 앱
1.4.4 소비자 피드 구독 서비스
1.4.5 부분 유료화 비즈니스 모델
1.4.6 인앱 결제 모델
1.5 비구독 서비스의 이탈 시나리오
1.5.1 이탈로 간주되는 휴면 상태
1.5.2 무료 평가판 전환
1.5.3 업셀링/다운셀링
1.5.4 다른 예/아니요(이항) 고객 예측
1.5.5 고객 행동 예측
1.5.6 이탈과는 다른 사용 사례
1.6 고객 행동 데이터
1.6.1 일반적인 상품 카테고리에서의 고객 이벤트
1.6.2 가장 중요한 이벤트
1.7 이탈과 싸우는 사례 분석
1.7.1 Klipfolio
1.7.2 Broadly
1.7.3 Versature
1.7.4 소셜 네트워크 시뮬레이션
1.8 뛰어난 고객 메트릭에 대한 사례 연구
1.8.1 활용도
1.8.2 성공률
1.8.3 단가
요약
2장 이탈 측정
2.1 이탈률의 정의
2.1.1 이탈률과 리텐션율의 계산
2.1.2 이탈률과 리텐션율의 관계
2.2 구독 데이터베이스
2.3 기본적인 이탈 계산: 순 리텐션
2.3.1 순 리텐션 계산
2.3.2 SQL 순 리텐션 계산
2.3.3 순 리텐션 해석하기
2.4 표준 계정 기반 이탈
2.4.1 표준 이탈률 정의
2.4.2 이탈 계산을 위한 외부 조인
2.4.3 SQL을 통한 표준 이탈 계산
2.4.4 표준 이탈률 사용 시기
2.5 비구독 제품의 활동(이벤트 기반) 이탈
2.5.1 활성 계정 및 이벤트로 인한 이탈 정의하기
2.5.2 SQL을 통한 활동 이탈 계산
2.6 고급 이탈: 월간 반복 수익(MRR) 이탈
2.6.1 MRR 이탈 정의 및 계산
2.6.2 SQL을 사용한 MRR 이탈 계산
2.6.3 MRR 이탈 vs 계정 이탈 vs 순 (리텐션) 이탈
2.7 이탈률 측정 변환
2.7.1 생존자 분석(고급)
2.7.2 이탈률 전환
2.7.3 SQL에서 모든 이탈 측정 기간 변환하기
2.7.4 이탈 측정 기간 선택하기
2.7.5 계절성과 이탈률
요약
3장 고객 측정
3.1 이벤트에서 메트릭으로
3.2 이벤트 데이터 웨어하우스 스키마
3.3 단일 기간의 이벤트 집계
3.4 메트릭 기간 정의의 세부 사항
3.4.1 주간 행동 주기
3.4.2 메트릭 측정의 타임스탬프
3.5 다양한 시점의 측정
3.5.1 측정 기간 중첩
3.5.2 메트릭 측정 타이밍
3.5.3 메트릭 측정값 저장
3.5.4 시뮬레이션 예제에 대한 메트릭 저장
3.6 이벤트 속성의 합계 및 평균 측정
3.7 메트릭 품질 보증
3.7.1 시간 경과에 따른 메트릭 변화 테스트
3.7.2 메트릭 품질 보증(QA) 사례 연구
3.7.3 메트릭이 있는 계정 수 확인
3.8 이벤트 QA
3.8.1 시간 경과에 따른 이벤트 변화 확인
3.8.2 계정당 이벤트 확인
3.9 행동 측정을 위한 측정 기간 선택
3.10 계정 유지기간 측정
3.10.1 계정 유지기간 정의
3.10.2 계정 유지기간의 재귀적 테이블 표현식
3.10.3 계정 유지기간 SQL 프로그램
3.11 MRR 및 기타 구독 메트릭 측정하기
3.11.1 메트릭으로서 MRR 계산하기
3.11.2 특정 금액의 구독
3.11.3 구독 단위 수량을 메트릭으로 계산하기
3.11.4 메트릭으로서의 청구 기간 계산하기
요약
4장 갱신 및 이탈 관찰
4.1 데이터셋 소개
4.2 고객 관찰 방법
4.2.1 관찰 리드 타임
4.2.2 갱신과 이탈의 시퀀스 관찰
4.2.3 구독 데이터셋 생성 개요
4.3 구독에서 활성 기간 식별하기
4.3.1 활성 기간
4.3.2 활성 기간 저장 스키마
4.3.3 진행 중인 활성 기간 찾기
4.3.4 이탈로 끝나는 활성 기간 찾기
4.4 비구독 제품의 활성 기간 확인
4.4.1 활성 기간 정의
4.4.2 이벤트에서 데이터셋을 형성하는 프로세스
4.4.3 활동 주 계산을 위한 SQL
4.5 관찰 날짜 선택
4.5.1 이탈과 비이탈 관찰의 균형 맞추기
4.5.2 관찰 날짜 선택 알고리듬
4.5.3 관찰 날짜 SQL 프로그램
4.6 이탈 데이터셋 내보내기
4.6.1 데이터셋 생성 SQL 프로그램
4.7 세분화를 위해 현재 고객 내보내기
4.7.1 활성 계정 및 메트릭 선택하기
4.7.2 메트릭 기반의 고객 세분화
요약
2부 전쟁 개시
5장 메트릭을 통해 이탈 및 행동 이해하기
5.1 메트릭 코호트 분석
5.1.1 코호트 분석의 기본 개념
5.1.2 파이썬 코호트 분석
5.1.3 제품 사용 코호트
5.1.4 계정 유지기간 코호트
5.1.5 청구 기간에 대한 코호트 분석
5.1.6 코호트의 최소 크기
5.1.7 유의미한 코호트와 그렇지 않은 코호트의 차이
5.1.8 대다수의 고객 메트릭이 0인 메트릭 코호트
5.1.9 인과관계: 메트릭이 이탈의 원인인가?
5.2 고객 행동 요약
5.2.1 메트릭의 분포 이해하기
5.2.2 파이썬으로 데이터셋의 요약 통계 계산하기
5.2.3 희귀 메트릭 제외하기
5.2.4 데이터 품질 보증에 비즈니스 담당자 참여시키기
5.3 메트릭 점수화
5.3.1 메트릭 점수의 기본 개념
5.3.2 메트릭 점수 알고리듬
5.3.3 파이썬으로 메트릭 점수 계산하기
5.3.4 점수 메트릭을 사용한 코호트 분석
5.3.5 월간 반복 수익에 대한 코호트 분석
5.4 원치 않거나 유효하지 않은 관찰 삭제하기
5.4.1 이탈 분석에서 미결제 고객 제거하기
5.4.2 파이썬에서 메트릭 임곗값을 기준으로 관찰값 제거하기
5.4.3 희귀 메트릭 분석에서 0인 측정값 제거하기
5.4.4 이탈 행동: 이탈률 증가와 관련된 메트릭
5.5 코호트 분석을 통한 고객 세분화
5.5.1 세분화 프로세스
5.5.2 세그먼트 기준 선택하기
요약
6장 고객 행동 간의 관계
6.1 행동 간의 상관관계
6.1.1 메트릭 쌍 간의 상관관계
6.1.2 파이썬으로 상관관계 조사하기
6.1.3 상관 행렬을 사용해 메트릭 집합 간의 상관관계 이해하기
6.1.4 사례 연구의 상관 행렬
6.1.5 파이썬에서 상관 행렬 계산하기
6.2 행동 메트릭 그룹의 평균 내기
6.2.1 상관관계가 있는 메트릭 점수를 평균 내는 이유
6.2.2 가중치 행렬을 사용해 점수를 평균 내기(적재 행렬)
6.2.3 적재 행렬 사례 연구
6.2.4 파이썬에서 적재 행렬 적용하기
6.2.5 메트릭 그룹 평균 점수에 대한 이탈 코호트 분석
6.3 상호 연관된 메트릭 그룹 발견하기
6.3.1 상관관계를 군집화하여 메트릭 그룹화하기
6.3.2 파이썬에서 상관관계 군집화하기
6.3.3 점수 평균을 점수로 만드는 적재 행렬 가중치
6.3.4 메트릭 그룹화 및 그룹화된 코호트 분석 코드 실행하기
6.3.5 군집화를 위한 상관관계 임곗값 선택하기
6.4 비즈니스 담당자에게 상호 연관된 메트릭 그룹 설명하기
요약
7장 고급 메트릭으로 고객 세그먼트화하기
7.1 비율 메트릭
7.1.1 비율 메트릭을 사용해야 하는 경우와 그 이유
7.1.2 비율 메트릭을 계산하는 방법
7.1.3 비율 메트릭 사례 연구 예시
7.1.4 시뮬레이션된 소셜 네트워크에 대한 추가 비율 메트릭
7.2 합계 메트릭의 비율
7.2.1 합계 메트릭의 백분율 계산하기
7.2.2 두 메트릭에 대한 합계 메트릭의 백분율 사례 연구
7.2.3 여러 메트릭에 대한 합계 메트릭의 백분율 사례 연구
7.3 변화를 측정하는 메트릭
7.3.1 활동 수준 변화 측정하기
7.3.2 극단적인 이상값(팻 테일)이 있는 메트릭의 점수
7.3.3 마지막 활동 이후 시간 측정하기
7.4 메트릭 기간 조정하기
7.4.1 긴 메트릭을 짧은 기간으로 조정하기
7.4.2 새 계정에 대한 메트릭 추정하기
7.5 사용자 메트릭
7.5.1 활성 사용자 측정
7.5.2 활성 사용자 메트릭
7.6 어떤 비율을 쓸 것인가?
7.6.1 왜 비율을 사용하며, 그 외에는 무엇이 있는가?
7.6.2 어떤 비율을 쓸 것인가?
요약
3부 특수 무기와 전술
8장 이탈 예측
8.1 모델을 사용해 이탈 예측하기
8.1.1 모델을 사용한 확률 예측
8.1.2 인게이지먼트 및 리텐션 확률
8.1.3 인게이지먼트 및 고객 행동
8.1.4 관찰된 이탈률과 S 곡선을 일치시키는 오프셋
8.1.5 로지스틱 회귀 확률 계산
8.2 데이터 준비 검토
8.3 이탈 모델 피팅하기
8.3.1 로지스틱 회귀 분석 결과
8.3.2 로지스틱 회귀 코드
8.3.3 로지스틱 회귀 결과 설명하기
8.3.4 로지스틱 회귀 사례 연구
8.3.5 보정 및 과거 이탈 확률
8.4 이탈 확률 예측하기
8.4.1 예측을 위한 현재 고객 데이터셋 준비하기
8.4.2 세그먼트화를 위한 현재 고객 데이터 준비하기
8.4.3 저장된 모델을 사용해 예측하기
8.4.4 예측 사례 연구
8.4.5 예측 보정 및 예측 추이
8.5 이탈 예측의 함정
8.5.1 상관 메트릭
8.5.2 이상값
8.6 고객 생애 가치
8.6.1 CLV의 의미
8.6.2 이탈에서 기대 고객 생애까지
8.6.3 CLV 공식
요약
9장 예측 정확도와 머신러닝
9.1 이탈 예측의 정확도 측정하기
9.1.1 이탈에 표준 정확도 측정을 사용하지 않는 이유
9.1.2 AUC로 이탈 예측 정확도 측정하기
9.1.3 향상도를 통한 이탈 예측 정확도 측정
9.2 과거 정확도 시뮬레이션: 백테스트
9.2.1 백테스트의 목적과 이유
9.2.2 백테스트 코드
9.2.3 백테스트 고려사항 및 위험 요소
9.3 회귀 제어 매개변수
9.3.1 회귀 가중치의 강도와 개수 제어하기
9.3.2 제어 매개변수를 사용한 회귀 분석
9.4 테스트를 통한 회귀 매개변수 선택(교차 검증)
9.4.1 교차 검증
9.4.2 교차 검증 코드
9.4.3 회귀 교차 검증 사례 연구
9.5 머신러닝을 통한 이탈 위험 예측
9.5.1 XGBoost 학습 모델
9.5.2 XGBoost 교차 검증
9.5.3 XGBoost와 회귀의 정확도 비교
9.5.4 고급 메트릭과 기본 메트릭 비교
9.6 머신러닝 예측을 통한 고객 세그먼트화
요약
10장 이탈 인구통계 및 기업통계
10.1 인구통계 및 기업통계 데이터셋
10.1.1 인구통계 및 기업통계 데이터의 유형
10.1.2 소셜 네트워크 시뮬레이션을 위한 계정 데이터 모델
10.1.3 인구통계 데이터셋 SQL
10.2 인구통계 및 기업통계 카테고리의 이탈 코호트
10.2.1 인구통계 카테고리에 대한 이탈률 코호트
10.2.2 이탈률 신뢰 구간
10.2.3 신뢰 구간으로 인구통계 코호트 비교하기
10.3 인구통계 카테고리 그룹화하기
10.3.1 매핑 딕셔너리로 그룹 대표하기
10.3.2 그룹화된 카테고리를 사용한 코호트 분석
10.3.3 카테고리 그룹 디자인하기
10.4 날짜 및 숫자 기반 인구통계에 대한 이탈 분석
10.5 인구통계 데이터를 통한 이탈 예측
10.5.1 텍스트 필드를 더미 변수로 변환하기
10.5.2 범주형 더미 변수만으로 이탈 예측하기
10.5.3 더미 변수를 숫자 데이터와 결합하기
10.5.4 인구통계와 메트릭을 결합하여 이탈 예측하기
10.6 인구통계 데이터로 현재 고객 세그먼트화하기
요약
11장 이탈과의 싸움을 주도하기
11.1 이탈과 싸우기 위한 계획 세우기
11.1.1 데이터 처리 및 분석 체크리스트
11.1.2 비즈니스 체크리스트에 대한 커뮤니케이션
11.2 자신의 데이터로 책의 코드 실행하기
11.2.1 이 책의 데이터 스키마로 데이터 불러오기
11.2.2 자신의 데이터로 코드 실행하기
11.3 이 책의 코드를 다른 환경으로 이식하기
11.3.1 SQL 코드 이식하기
11.3.2 파이썬 코드 이식하기
11.4 추가 학습 및 연락하기
11.4.1 저자의 블로그 사이트와 소셜 미디어
11.4.2 이탈 벤치마크 정보 자료
11.4.3 이탈에 대한 기타 정보 자료
11.4.4 이탈에 도움이 되는 제품
요약
찾아보기