목차
[1부 개방형 모델 활용]
1장 생성 미디어 입문
_1.1 이미지 생성
_1.2 텍스트 생성
_1.3 사운드 클립 생성
_1.4 윤리적 및 사회적 영향
_1.5 생성 모델의 과거와 현재
_1.6 생성형 AI 모델 개발 방법
_1.7 요약
2장 트랜스포머
_2.1 언어 모델의 활용 사례
_2.2 트랜스포머 블록
_2.3 트랜스포머 모델 계보
_2.4 사전 학습의 힘
_2.5 트랜스포머 요약
_2.6 언어 모델을 이용한 텍스트 생성 프로젝트
_2.7 요약
_연습 문제
_도전 과제
_참고 자료
3장 정보 압축과 표현
_3.1 오토인코더
_3.2 변이형 오토인코더
_3.3 CLIP
_3.4 CLIP의 대안
_3.5 의미 기반 이미지 검색 프로젝트
_3.6 요약
_연습 문제
_도전 과제
_참고 자료
4장 확산 모델
_4.1 핵심 원리: 반복 정제
_4.2 확산 모델 학습
_4.3 노이즈 스케줄 심층 분석
_4.4 U-Net과 대안 심층 분석
_4.5 확산 목표 심층 분석
_4.6 비조건부 확산 모델 학습 프로젝트
_4.7 요약
_연습 문제
_도전 과제
_참고 자료
5장 스테이블 디퓨전과 조건부 생성
_5.1 조건부 확산 모델을 위한 조건 추가하기
_5.2 효율성을 높이는 잠재 확산
_5.3 스테이블 디퓨전 구성 요소 심층 분석
_5.4 주석이 달린 샘플링 루프
_5.5 오픈 데이터, 오픈 모델
_5.6 Gradio로 인터랙티브 머신러닝 데모 만들기 프로젝트
_5.7 요약
_연습 문제
_도전 과제
_참고 자료
[2부 생성 모델을 위한 전이 학습]
6장 언어 모델 파인튜닝
_6.1 텍스트 분류
_6.2 텍스트 생성
_6.3 지시 사항
_6.4 어댑터 소개
_6.5 양자화 소개
_6.6 통합 구현
_6.7 평가 방법에 대한 더 깊은 이해
_6.8 검색 증강 생성 프로젝트
_6.9 요약
_연습 문제
_도전 과제
_참고 자료
7장 스테이블 디퓨전 파인튜닝
_7.1 스테이블 디퓨전 전체 모델 파인튜닝
_7.2 드림부스
_7.3 LoRA 학습
_7.4 스테이블 디퓨전에 새로운 기능 추가하기
_7.5 SDXL 드림부스 LoRA 학습하기 프로젝트
_7.6 요약
_연습 문제
_도전 과제
_참고 자료
[3부 더 나아가기]
8장 텍스트-이미지 모델의 창의적 활용
_8.1 이미지-이미지 변환
_8.2 인페인팅
_8.3 프롬프트 가중치와 이미지 편집
_8.4 인버전으로 실제 이미지 편집하기
_8.5 컨트롤넷
_8.6 이미지 프롬프팅과 이미지 변형
_8.7 창의적 그림 생성 프로젝트
_8.8 요약
_연습 문제
_참고 자료
9장 오디오 생성
_9.1 오디오 데이터
_9.2 트랜스포머 기반 아키텍처를 활용한 음성-텍스트 변환
_9.3 텍스트에서 음성으로, 생성 오디오로
_9.4 오디오 생성 시스템 평가
_9.5 향후 발전 방향
_9.6 엔드-투-엔드 대화 시스템 프로젝트
_9.7 요약
_연습 문제
_도전 과제
_참고 자료
10장 생성형 AI 분야의 발전과 최신 동향
_10.1 선호도 최적화
_10.2 긴 컨텍스트
_10.3 전문가 혼합
_10.4 최적화와 양자화
_10.5 데이터
_10.6 모든 것을 해결하는 단일 모델
_10.7 컴퓨터 비전
_10.8 3D 컴퓨터 비전
_10.9 비디오 생성
_10.10 멀티 모달리티
_10.11 커뮤니티
APPENDIX A. 오픈 소스 도구
APPENDIX B. LLM 메모리 요구사항
APPENDIX C. 엔드-투-엔드 검색 증강 생성