수식과 그림으로 확산 모델 제대로 이해하기
DALL-E2, 미드저니, 스테이블 디퓨전 등 텍스트로 이미지를 생성하는 인공지능의 발달이 가져온 충격을 우리 모두 목격했다. 이러한 기술의 바탕에 있는 것이 바로 확산 모델이다. 오늘날의 생성 AI를 이해하려면 고품질 데이터를 생성하는 확산 모델을 이해하는 것이 필수불가결하지만, 관련 자료는 부족한 실정이다.
이 책은 확산 모델의 기본적인 개념부터 그 발전 과정과 응용 사례를 자세히 설명한다. 수식을 더 직관적으로 이해할 수 있도록 여러 그림과 그래프를 함께 제공하며, 학습 안정성, 우도 추정, 조건부 생성 등을 기존 생성 모델과 비교해 살펴봄으로써 확산 모델을 명확히 이해할 수 있다.
이 책이 더욱 특별한 이유는 일본 AI 1위 업체인 Preferred Networks의 최고연구책임자 오카노하라 다이스케가 집필했다는 점이다. ‘기술을 둘러싼 풍부한 맥락을 제공’한다고 평가받는 베테랑 저자이기도 한 오카노하라 다이스케는 이 책으로 32회 오카와 출판상을 수상했다. 오늘날 인공지능의 중심에 있는 확산 모델을 제대로 이해하고자 한다면 이 책이 길잡이가 될 것이다.
주요 내용
● 생성 모델의 개요와 기본 개념
● SNR과 점수 기반 모델로 이해하는 확산 모델
● 연속 시간 확산 모델 및 확산 모델의 특장점
● 분류기 가이던스, 부분공간, 대칭성 등 확산 모델의 발전
● 동영상, 음성 합성, 화합물 등 확산 모델의 응용 사례