장바구니 담기 close

장바구니에 상품을 담았습니다.

LLM 프로덕션 엔지니어링

LLM 프로덕션 엔지니어링

  • 루이-프랑수아 부샤르
  • |
  • 제이펍
  • |
  • 2025-09-11 출간
  • |
  • 516페이지
  • |
  • 188 X 245 X 25mm
  • |
  • ISBN 9791194587347
판매가

36,000원

즉시할인가

32,400

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

예약도서

09월18일 출고예정

수량
+ -
총주문금액
32,400

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평

LLM으로 구현하는 실무형 AI 서비스 개발
LLM은 빠르게 진화하며 새로운 모델과 기법이 끊임없이 등장하고 있지만 지금 사용되는 개발 도구와 기술이 더 발전된 AI 모델을 다루는 기본 토대가 된다. 이 토대를 깊이 이해한 사람이 앞으로 나올 더 강력한 모델도 가장 효과적으로 활용할 수 있다. AI는 자연어 처리뿐 아니라 알고리즘 설명, 소프트웨어 개발, 학술 개념 해설, 생성형 이미지 제작 등 다양한 분야에서 활용되며, 산업 전반에 혁신을 불러오고 있다.

이 책은 LLM과 자연어 처리의 최신 동향을 소개하고, 모델의 작동 원리를 깊이 있게 설명하면서도 실무에 바로 쓸 수 있는 방법을 제시한다. 특히 RAG 파이프라인 구축 프로젝트를 통해 텍스트를 처리하고 맥락에 맞게 상호작용하는 최신 기술을 직접 다룬다. LLM을 특정 용도에 맞춰 정확성과 신뢰성을 높이는 필수 기술 스택인 프롬프트 엔지니어링, 파인튜닝, RAG를 중심으로, 실제 서비스에 적용 가능한 제품 제작 과정을 구체적으로 안내한다. 단순한 개념 설명을 넘어서 한계를 극복하는 전략과 실전 구현 방법까지 제시해 개발자가 직접 애플리케이션과 제품을 완성할 수 있도록 돕는다.

총 12장으로 구성된 이 책은 LLM의 핵심 개념부터 실무 적용까지 체계적으로 다룬다. 1장은 확장 법칙, 콘텍스트 크기, 창발적 능력 등 LLM이 강력한 이유를 살펴보고, 2장은 트랜스포머 아키텍처와 각 레이어 구성 요소를 중심으로 다양한 모델 설계를 설명한다. 3장은 환각, 레이턴시, 컴퓨팅 제약 같은 한계를 분석하고, 4장은 퓨샷 학습과 체인 프롬프트 등 프롬프트 기술을 코드 예제와 함께 실습한다. 5장은 RAG 기본 원칙과 벡터 데이터베이스 개념, 데이터 저장 및 검색 방법을 다루고, 6장은 LangChain과 LlamaIndex로 LLM 작업을 단순화하는 방법을 설명한다.

7장은 다양한 프롬프트 유형과 응답 제어, 추적 기법을, 8장은 인덱스 생성, 데이터 분할, 저장 등 검색 최적화를 다룬다. 9장은 고급 RAG 기법과 잠재적 문제 해결, 챗봇 성능 평가를 다루며 LangSmith 활용법까지 함께 소개한다. 이어 10장은 외부 환경과 상호작용하는 지능형 에이전트를, 11장은 LoRA와 QLoRA를 활용한 파인튜닝 전략을 다룬다. 마지막 12장에서는 모델 증류, 양자화, 가지치기 등으로 성능을 유지하면서 비용을 줄이는 최적화 방법을 제안한다. 각 장에는 RAG 기반 뉴스 요약기, 고객 지원 Q&A 챗봇, Whisper와 LangChain을 활용한 유튜브 영상 요약기, PDF 금융 문서 분석기, LoRA 기반 금융 감정 분석 등 실제 구현이 가능한 19개의 프로젝트가 포함되어 있으며, 개념을 실습과 함께 익히며 실무에 바로 적용할 수 있다.

시간이 지나 모델이나 구현 방식이 바뀌더라도 이 책에서 다루는 원칙과 접근 방법은 여전히 유효하다. 지금 필요한 실무 지식일 뿐 아니라 앞으로 등장할 더 발전된 모델을 다루는 데도 그대로 활용할 수 있을 것이다.

주요 내용LLM 구조 이해와 모델 선택 전략프롬프트 엔지니어링 및 응답 제어 기법벡터 검색 기반 RAG 파이프라인 구축랭체인, 라마인덱스 활용LoRA, QLoRA 기반 파인튜닝AutoGPT, BabyAGI 등 에이전트 기술랭스미스를 활용한 평가 및 디버깅양자화, 모델 경량화, 최적화, 배포 전략
이 책에서 직접 해보는 19가지 실전 LLM 프로젝트LLM을 활용한 번역퓨샷 학습을 통한 LLM 출력 제어LangChain을 사용한 LLM 기반 애플리케이션 구축뉴스 기사 요약기 구축출력 파서를 사용한 출력 관리뉴스 기사 요약기 개선텍스트 데이터를 활용한 지식 그래프 생성고객 지원 Q&A 챗봇Whisper와 LangChain을 이용한 유튜브 비디오 요약기자기 비판 체인을 사용한 원치 않는 출력 방지고객 서비스 챗봇에서 부적절한 출력 방지분석 보고서 작성 에이전트 구축LlamaIndex를 사용한 데이터베이스 쿼리 및 요약OpenAI 어시스턴트를 활용한 에이전트 구축LangChain OpenGPTs멀티모달 금융 문서 분석기로 PDF 파일 분석LoRA를 활용한 SFTSFT 및 LoRA를 활용한 금융 감정 분석의료 데이터를 활용한 Cohere LLM 파인튜닝RLHF를 통한 LLM 성능 향상

목차

지은이·옮긴이 소개 xi
옮긴이 머리말 xiii
추천의 글 xv
베타리더 후기 xvii
추천사 xix
시작하며 xxii
감사의 글 xxvii
이 책에 대하여 xxviii

CHAPTER 1 LLM 소개 1
1.1 언어 모델의 짧은 역사 1
1.2 LLM이란 무엇인가? 2
1.3 LLM의 기본 구성 요소 3
1.4 실습 ❶ LLM을 활용한 번역(GPT-3.5 API) 19
1.5 실습 ❷ 퓨샷 학습을 통한 LLM 출력 제어 20
1.6 요약 22

CHAPTER 2 LLM 아키텍처와 환경 23
2.1 트랜스포머 이해하기 23
2.2 트랜스포머 모델의 설계와 선택 33
2.3 트랜스포머 아키텍처 최적화 기법 41
2.4 GPT 아키텍처 43
2.5 대형 멀티모달 모델 소개 46
2.6 상용 모델 vs. 공개 모델 vs. 오픈소스 언어 모델 52
2.7 LLM의 응용 및 사용 사례 59
2.8 요약 67

CHAPTER 3 LLM의 실제 응용 69
3.1 환각과 편향 이해하기 69
3.2 LLM 출력에서 환각을 줄이는 방법 71
3.3 LLM 성능 평가 79
3.4 요약 84

CHAPTER 4 프롬프트 엔지니어링 소개 86
4.1 프롬프팅과 프롬프트 엔지니어링 86
4.2 프롬프트 테크닉 91
4.3 프롬프트 인젝션과 보안 97
4.4 요약 100

CHAPTER 5 RAG 102
5.1 왜 RAG인가? 102
5.2 밑바닥부터 시작하는 기본 RAG 파이프라인 구축 106
5.3 요약 119

CHAPTER 6 LangChain 및 LlamaIndex 소개 120
6.1 LLM 프레임워크 120
6.2 LangChain 소개 121
6.3 실습 ❶ LangChain을 사용한 LLM 기반 애플리케이션 구축 126
6.4 실습 ❷ 뉴스 기사 요약기 구축 130
6.5 LlamaIndex 소개 137
6.6 LangChain vs. LlamaIndex vs. OpenAI Assistant 145
6.7 요약 147

CHAPTER 7 LangChain을 사용한 프롬프트 작성 148
7.1 LangChain 프롬프트 템플릿이란 148
7.2 퓨샷 프롬프트와 예시 선택기 156
7.3 LangChain에서 체인이란 163
7.4 실습 ❶ 출력 파서를 사용한 출력 관리 171
7.5 실습 ❷ 뉴스 기사 요약기 개선 183
7.6 실습 ❸ 텍스트 데이터를 활용한 지식 그래프 생성: 숨겨진 연결 고리 발견하기 191
7.7 요약 197

CHAPTER 8 인덱스, 검색기, 그리고 데이터 준비 199
8.1 LangChain의 인덱스와 검색기 199
8.2 데이터 수집 205
8.3 텍스트 분할기 209
8.4 유사도 검색과 벡터 임베딩 219
8.5 실습 ❶ 고객 지원 Q&A 챗봇 225
8.6 실습 ❷ Whisper와 LangChain을 이용한 유튜브 비디오 요약기 232
8.7 실습 ❸ 지식 베이스를 위한 음성 비서 243
8.8 실습 ❹ 자기 비판 체인을 사용한 원치 않는 출력 방지 255
8.9 실습 ❺ 고객 서비스 챗봇에서 부적절한 출력 방지 260
8.10 요약 265

CHAPTER 9 고급 RAG 268
9.1 개념 증명에서 제품으로: RAG 시스템의 도전 과제 268
9.2 고급 RAG 기법과 LlamaIndex 269
9.3 RAG의 지표 및 평가 284
9.4 LangChain, LangSmith 및 LangChain Hub 299
9.5 요약 304

CHAPTER 10 에이전트 306
10.1 에이전트: 추론 엔진으로서의 대형 모델 306
10.2 AutoGPT와 BabyAGI 한 눈에 보기 312
10.3 LangChain의 에이전트 시뮬레이션 프로젝트 327
10.4 실습 ❶ 분석 보고서 작성 에이전트 구축 332
10.5 실습 ❷ LlamaIndex를 사용한 데이터베이스 쿼리 및 요약 340
10.6 실습 ❸ OpenAI 어시스턴트를 활용한 에이전트 구축 350
10.7 실습 ❹ LangChain OpenGPTs 354
10.8 실습 ❺ 멀티모달 금융 문서 분석기로 PDF 파일 분석하기 357
10.9 요약 371

CHAPTER 11 파인튜닝 372
11.1 파인튜닝에 대한 이해 372
11.2 LoRA 373
11.3 실습 ❶ LoRA를 활용한 SFT 376
11.4 실습 ❷ SFT 및 LoRA를 활용한 금융 감정 분석 389
11.5 실습 ❸ 의료 데이터를 활용한 Cohere LLM 파인튜닝 398
11.6 RLHF 408
11.7 실습 ❹ RLHF를 통한 LLM 성능 향상 411
11.8 요약 433

CHAPTER 12 배포 및 최적화 435
12.1 모델 증류와 교사-학생 모델 435
12.2 LLM 배포 최적화: 양자화, 가지치기, 추측적 디코딩 441
12.3 실습: GCP에서 CPU로 양자화된 LLM 배포하기 452
12.4 오픈소스 LLM을 클라우드 환경에 배포하기 461
12.5 요약 463

나가며 465
용어집 468
찾아보기 472

도서소개


 

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 : 070-4821-5101
교환/반품주소
  • 부산광역시 부산진구 중앙대로 856 303호 / (주)스터디채널 / 전화 : 070-4821-5101
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.