이제 AI 서비스의 핵심은 최적화!
LLM 서비스 설계의 모든 것을 배운다!
딥시크처럼 적은 투자로 높은 성능을 내는 LLM이 등장하며, AI 개발 과정에 최적화라는 키워드가 새로이 떠올랐습니다. 이 책은 소형 모델(SLM) 활용법, 효과적인 프롬프트 엔지니어링, 파인튜닝, 양자화 기법까지, 효율적인 투자로 고성능 AI 서비스를 구축하는 데 필요한 실질적인 방법론과 이론을 폭넓게 다룹니다. 다양한 사례와 이론을 바탕으로, AI 기술 도입 비용 문제로 고민하는 스타트업, 기업, 개발자들에게 깊이 있는 인사이트를 제공합니다. 비용은 줄이고 성능은 높이는 LLM 최적화 전략이 필요한 모든 분께 실질적인 도움이 되길 바랍니다.
주요 내용
● LLM의 높은 계산 비용 문제를 해결하는 효과적인 기법
● 비용 효율적인 생성 AI 서비스를 만드는 파인튜닝과 추론, 양자화 기법
● 소형 모델, 도메인 특화 모델 등 대안 모델
대상 독자
● 효율적인 AI 모델을 구축, 튜닝, 배포하고 싶은 실무 엔지니어
● AI 서비스에 대한 비즈니스적인 평가를 내리려는 기획자 및 결정권자
● LLM을 비롯한 인공지능 모델의 전반적인 기술을 알고 싶은 개발자
● 생성형 AI 및 LLM을 연구하는 학생 및 교수