장바구니 담기 close

장바구니에 상품을 담았습니다.

자연어 처리의 정석

자연어 처리의 정석

  • 제이콥에이젠슈테인
  • |
  • 에이콘출판
  • |
  • 2022-05-30 출간
  • |
  • 688페이지
  • |
  • 188 X 235 X 32 mm
  • |
  • ISBN 9791161756455
판매가

50,000원

즉시할인가

45,000

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
45,000

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평




◈ 이 책에서 다루는 내용 ◈

이 책은 자연어 처리의 다양한 핵심 개념을 다룬다. 자연어 처리 작업을 위한 수많은 문제는 다음의 여러 방법을 사용해 해결할 수 있다.

◆ 탐색: 비터비 탐색, CKY 알고리듬, 스패닝 트리, 이동 감소, 정수 선형 프로그래밍, 빔 탐색
◆ 학습: 최대 우도 추정, 로지스틱 회귀, 퍼셉트론, 기댓값 - 최대화, 행렬 분해, 역전파

이 책에서는 이러한 방법들이 어떻게 동작하는지 설명하고, 광범위한 자연어 처리 작업에 어떻게 적용할 수 있을지 다뤄본다. 또한 문서 분류, 단어 의미 모호성, 품사 태깅, 개체명 인식, 파싱, 상호 참조 해결, 관계 추출, 담화 분석, 언어 모델링, 기계 번역 등과 같은 여러 자연어 처리 작업에 대해서 함께 다룬다.

◈ 이 책의 대상 독자 ◈

어느 정도 소프트웨어 지식이 있는 엔지니어와 대학원생 수준 이상의 연구자들에게 적합한 책이다. 각 장은 서로 독립돼 있지만 어느 순간 자연스레 통합되도록 구성됐다. 필요한 부분만 찾아서 읽어도 좋고, 전체를 하나씩 훑으며 큰 줄기를 잡는 것도 좋다.

◈ 이 책의 구성 ◈

기본적인 내용을 익힌 후, 다음의 4개 주요 영역을 다룬다.
◆ 학습: 다른 섹션에서 사용되는 여러 머신러닝 툴을 만들어볼 것이다. 머신러닝에 초점을 맞춰서 설명하기 때문에 텍스트 표현이나 언어학적인 현상들은 대부분 간단하다. “bag-of-words” 텍스트 분류를 예시 모델로 다룰 것이다. 4장에서는 단어 기반의 텍스트 분석에 관해 언어학적으로 흥미로운 응용 방법을 설명한다.
◆ 시퀀스와 트리: 언어를 구조학적인 현상에 비춰 설명하는 섹션이다. 시퀀스 및 트리 표현과 이들이 만들어내는 알고리듬에 대해 다루고 이러한 표현에서 발생되는 한계점에 대해서 설명한다. 9장에서는 유한 상태 오토마타(finite-state automata)에 대해 소개하고, 영어 구문론에서의 문맥 자유 언어를 짧게 소개한다.
◆ 의미: 형식 논리에서부터 뉴럴 단어 임베딩까지 텍스트를 통해 의미를 표현하고, 계산하기 위한 내용을 다룬다. 의미론과 밀접하게 관련 있는 참조 모호성을 해결하기 위한 방법과 담화 구조에서의 다문장 분석에 대한 두 가지 주제 등을 다룬다.
◆ 응용: 자연어 처리에 대한 주요한 응용 문제인 정보 추출, 기계 번역, 텍스트 생성에 대해 설명한다. 각 장에서 뉴럴 어텐션과 같은 방법을 소개하면서 이 책의 앞부분에서 구축한 형식과 방법을 사용해 가장 잘 알려진 시스템 중 일부를 설명한다.

◈ 옮긴이의 말 ◈

공부하던 강의(NLP 224n)에서 이 책을 처음 만난 후로, 실무를 하다가 이해 안 가는 부분을 찾아보며 일주일 동안 다섯 번 정도 이 책과 저자가 쓴 글을 마주했을 때 느꼈던 운명 같은 느낌을 아직도 간직하고 있습니다. 그러고 나서 운이 좋게도 이 책을 번역할 기회가 주어졌을 때는 운명이지 않을까 생각했습니다.
어느 책이나 번역하는 일은 항상 하늘이 내린 일이라고 생각하지만, 자연어 책을 참고하며 번역하는 일은 더욱 숙명적이고도 어려운 일이었습니다. 실력이 부족한 점도 없지 않아 있었겠지만 익숙하지 않은 언어학적인 관점을 충분히 이해하고 번역해야 하기 때문입니다. 모국어도 언어학적인 관점에서 보는 한글과 실제로 사용하는 한국어가 다릅니다. 또 한글로 쓰인 수필, 소설, 에세이, 기사 등의 문장에서 느껴지는 작은 묘미를 독자들은 크게 느끼지만, 짧은 문장에도 숨겨진 문법성의 의미와 언어학적 의미를 살려서 번역하는 것은 정말 힘든 일이었습니다.
이 책은 자연어 처리의 정석이라고도 할 수 있는 교과서 스타일의 책입니다. 한국어로 잘 설명된 교과서를 보는 것도 상당한 에너지가 필요하고, 시작하기 전 마음을 다잡아야 하는데 이런 어려운 면면을 다 가진 책이라니, 이 책을 펼쳐 든 독자들도 앞으로의 길이 쉽지 않으리라 생각합니다.
하지만 확언하건대 이 책은 자연어 처리에 관한 가장 탁월하게 설명하며, 끝까지 읽으면 실력을 굉장히 향상시켜줄 것입니다. 실력이 어느 정도 쌓인 후, 실무에 적용하는 수준이 되고 나면 각각으로 쪼개져 있는 지식의 양을 더 넓히는 동시에 합칠 줄 알아야 한다고 생각합니다. 또 알고 있는 지식 사이에 듬성듬성 나 있는 구멍을 메워야 하는 시기가 온다고 생각합니다. 그런 과정에 있다면 이 책은 최고의 책입니다. 자연어 처리 분야의 일부만 연구했더라도, word2vec과 BERT를 사용하며 실무의 한 부분에만 익숙하더라도, 20년 전의 검색 엔진 분석을 위한 텍스트 파싱에만 익숙한 모든 분께 더 넓은 시야와 깊은 지식을 얻을 수 있는 책이리라 확신합니다.


목차


1장. 개요
1.1 자연어 처리와 그 이웃들
1.2 자연어 처리의 세 가지 주제

2장. 선형 텍스트 분류
2.1 단어 가방
2.2 나이브 베이즈
2.3 결정 학습
2.4 손실함수와 큰 마진 분류
2.5 로지스틱 회귀
2.6 최적화
2.7 분류에서의 또 다른 주제들
2.8 학습 알고리듬 요약

3장. 비선형 분류
3.1 피드포워드 뉴럴 네트워크
3.2 뉴럴 네트워크 디자인하기
3.3 뉴럴 네트워크 학습하기
3.4 컨볼루셔널(합성곱) 뉴럴 네트워크

4장. 언어 기반의 분류 응용
4.1 감성 및 의견 분석
4.2 단어 의미의 모호성
4.3 텍스트 분류를 위한 의사 결정 디자인
4.4 분류기 평가하기
4.5 데이터 세트 만들기

5장. 비지도 학습
5.1 비지도 학습
5.2 기댓값 최대화의 적용
5.3 준지도 학습
5.4 도메인 적응
5.5 잠재변수가 있는 학습에 대한 여러 접근법

6장. 언어 모델
6.1 그램 언어 모델
6.2 평활화와 할인하기
6.3 순환 뉴럴 네트워크 언어 모델
6.4 언어 모델 평가하기
6.5 어휘집에 없는 단어

7장. 시퀀스 라벨링
7.1 분류에서의 시퀀스 라벨링
7.2 구조 예측을 위한 시퀀스 라벨링
7.3 비터비 알고리듬
7.4 은닉 마르코프 모델
7.5 피처를 사용한 결정하는 시퀀스 라벨링
7.6 뉴럴 시퀀스 라벨링
7.7 비지도 시퀀스 라벨링

8장. 시퀀스 라벨링 응용
8.1 품사 식별
8.2 형태구문론적 속성
8.3 개체명 인식
8.4 토크나이제이션
8.5 코드 스위칭
8.6 대화 행위

9장. 형식 언어론
9.1 정규 언어
9.2 문맥 자유 언어
9.3 가벼운 문맥 의존 언어

10장. 문맥 자유 파싱
10.1 결정형 상향식 파싱
10.2 모호성
10.3 가중치가 있는 문맥 자유 문법
10.4 가중치가 있는 문맥 자유 문법 학습하기
10.5 문법 보정
10.6 문맥 자유 파싱을 너머

11장. 의존 파싱
11.1 의존 문법
11.2 그래프 기반 의존 파싱
11.3 전이 기반 의존 파싱
11.4 응용

12장. 논리적 의미론
12.1 의미와 표기
12.2 의미의 논리적 표현
12.3 의미 파싱과 람다 대수
12.4 의미 파서 학습하기

13장. 술어 인자 의미론
13.1 의미 역할
13.2 의미 역할 라벨링
13.3 추상 의미 표현

14장. 분포 의미와 분산 의미
14.1 분포 가설
14.2 단어 표현을 위한 디자인 결정
14.3 잠재 의미 분석
14.4 브라운 군집
14.5 뉴럴 단어 임베딩
14.6 단어 임베딩 평가하기
14.7 분포 통계량 너머의 분포된 표현
14.8 다중 단어 단위의 분포된 표현

15장. 참조 해결
15.1 참조 표현의 형태
15.2 상호 참조 해결을 위한 알고리듬
15.3 상호 참조 해결 표현하기
15.4 상호 참조 해결 평가하기

16장. 담화
16.1 분절
16.2 개체와 언급
16.3 관계

17장. 정보 추출
17.1 개체
17.2 관계
17.3 사건
17.4 헤지, 부정, 가정
17.5 질의 응답과 기계 독해

18장. 기계 번역
18.1 기계 번역 작업
18.2 통계적 기계 번역
18.3 뉴럴 기계 번역
18.4 디코딩
18.5 평가 지표 훈련

19장. 텍스트 생성
19.1 데이터를 통한 텍스트 생성
19.2 텍스트를 통한 텍스트 생성
19.3 대화

부록 A. 확률
A.1 사건 조합의 확률
A.2 조건부 확률과 베이즈 규칙
A.3 독립
A.4 확률변수
A.5 기댓값
A.6 모델링과 추정

부록 B. 수치 최적화
B.1 경사 하강
B.2 제약 조건이 있는 최적화
B.3 예시: 수동적 - 능동적 온라인 학습

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 : 070-4821-5101
교환/반품주소
  • 부산광역시 부산진구 중앙대로 856 303호 / (주)스터디채널 / 전화 : 070-4821-5101
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.