서브메뉴
검색
본문
Powered by NAVER OpenAPI
-
텐서플로와 머신러닝으로 시작하는 자연어 처리 (로지스틱 회귀부터 트랜스포머 챗봇까지)
저자 : 전창욱|최태균|조중현
출판사 : 위키북스
출판년 : 2019
ISBN : 9791158391379
책소개
본 서는 기존 자연어 처리 서적과는 다른 세 가지 특징을 가지고 있다. 첫째, 자연어 처리에 활용되는 개념적인 설명에서 끝나는 것이 아니라 모델 구현에 집중한다. 그뿐만 아니라 상용 서비스를 지원하는 텐서플로를 기반으로 모델을 개발한다. 둘째, 실무에서 자연어 처리 문제를 해결하는 데 조금이나마 도움이 되고자 캐글 대회의 문제를 활용했으며, 감정분석부터 유사도 처리, 챗봇에 이르기까지 다양한 문제를 다룬다. 셋째, 딥러닝 기반 자연어 처리를 다룬 서적은 대부분 번역서이기 때문에 주로 영어 데이터만 다루지만 이 책에서는 영어 데이터뿐만 아니라 한글 데이터를 활용한 문제 해결까지 다룬다.
목차
▣ 1장: 들어가며
이 책의 목표와 활용법
__아나콘다 설치
실습 환경 구축
가상 환경 구성
__실습 프로젝트 구성
__pip 설치
__주피터 노트북
정리
▣ 2장: 자연어 처리 준비
텐서플로
__tf.keras.layers
__tf.data
__에스티메이터(Estimator)
사이킷런
__사이킷런을 이용한 데이터 분리
__사이킷런을 이용한 지도학습
__사이킷런을 이용한 비지도학습
__사이킷런을 이용한 특징 추출
__TfidfVecotorizer
__자연어 토크나이징 도구
__영어 토크나이징 라이브러리
__한글 토크나이징 라이브러리
그 밖의 라이브러리(전처리)
__넘파이
__판다스
__Matplotlib
__맷플롯립 설치
__Matplotlib.pyplot
__re
캐글 사용법
정리
▣ 3장: 자연어 처리 개요
단어 표현
텍스트 분류
__텍스트 분류의 예시
텍스트 유사도
자언어 생성
기계 이해
데이터 이해하기
정리
▣ 4장: 텍스트 분류
영어 텍스트 분류
__문제 소개
__데이터 분석 및 전처리
__텍스트 모델링 소개
__분류 회귀 모델
__TF-IDF를 활용한 모델 구현
__랜덤 포레스트 분류 모델
__순환 신경망 분류 모델
__컨볼루션 신경망 분류 모델
한글 텍스트 분류
__문제 소개
__데이터 전처리 및 분석
__모델링
__마무리
▣ 5장: 텍스트 유사도
문제 소개
데이터 분석과 전처리
__XG 부스트 텍스트 유사도 분석 모델
모델링
__CNN 텍스트 유사도 분석 모델
__모델 구현
__MaLSTM
정리
▣ 6장: 챗봇 만들기
데이터 소개
데이터 분석
시퀀스 투 시퀀스 모델링
__모델 소개
트랜스포머 네트워크
__모델 구현
정리
▣ 부록
부록 A _ MaLSTM 모델
부록 B _ Seq2Seq 모델
부록 C _ 트랜스포머 모델