BAEWHA WOMEN'S UNIVERSITY LIBRARY

본문 바로가기
탑 메뉴 바로가기
주 메뉴 바로가기
하단 바로가기

Contents Info

파이썬 텍스트 마이닝 완벽 가이드 : 자연어 처리 기초부터 딥러닝 기반 BERT 모델까지

Material Type: 동서단행본

ISBN: 9791158393007 93500

DDC: 006.312-23

Callnumber: 006.312 ㅂ194ㅍ

Author: 박상언

Title/Author: 파이썬 텍스트 마이닝 완벽 가이드 : 자연어 처리 기초부터 딥러닝 기반 BERT 모델까지 / 박상언, 강주영, 정석찬 지음

Publish Info: 파주 : 위키북스, 2022

Material Info: xviii, 322 p. : 삽도 ; 24 cm

Added Entry-Title: 데이터 사이언스 시리즈 = = DS ; 077

서지주기: 찾아보기: p. 318-322

Added Entry-Personal Name: 강주영

Added Entry-Personal Name: 정석찬

Price Info: \28000

Control Number: bwcl:119574

책소개: 텍스트 마이닝에는 자연어 처리, 통계, 딥러닝 기법에 대해 많은 지식이 필요하지만, 이론적인 내용에 얽매이다 보면 정작 구현은 너무 먼 이야기가 되어 버리기 쉽다.

이 책에서는 실무에 바로 적용할 수 있는 실전적인 예제를 중심으로 텍스트 마이닝을 설명한다. 특히 초보자를 위해 텍스트 전처리 과정의 개념과 다양하고 상세한 활용방법을 기초부터 설명한다. 문서 분류와 감성 분석 같은 텍스트 마이닝 작업을 대상으로 다양한 머신러닝 기법을 사용하는 예를 보여주며, 차원을 축소하고 결과를 시각화하는 방법, 토픽 모델링을 수행하고 토픽 트렌드를 구해서 시각화하는 방법을 설명한다.

기본적인 딥러닝 기법을 이용한 문서 분류 외에, 최근 많이 사용되는 BERT를 이용한 미세조정학습까지 포함한다. 또한 한국어 문서 분석에 자신을 갖도록 대부분의 장에 관련 예제를 충분히 다뤘다.

★ 이 책에서 다루는 내용 ★

◎ 토큰화, 어간 추출, 표제어 추출, 불용어 처리, 품사 태깅과 같은 텍스트 전처리 기법
◎ 단어 빈도 그래프, 워드 클라우드 그리기
◎ 카운트 벡터, TF-IDF 벡터로 문서를 변환하고, 문서 간 유사도 구하기
◎ 다양한 머신러닝/딥러닝 기법으로 문서 분류와 감성 분석 수행
◎ KoNLPy를 이용해 한국어 문서를 변환하고 다양한 머신러닝 알고리즘으로 분석
◎ 문서 벡터의 차원 축소, LDA 토픽 모델링, 토픽 트렌드를 구하고 시각화
◎ Word2Vec, ELMo와 같은 워드 임베딩 기법과 Doc2Vec의 이해
◎ BERT의 이해와 활용, 파이토치를 이용한 미세조정 학습의 실습, 한국어 문서에 대한 BERT 사용법 실습

New Books MORE

최근 3년간 통계입니다.

Reservation
Not Exist
My Folder

Material
Reg No.	Call No.	Location	Status	Lend Info
EM0164211	006.312 ㅂ194ㅍ	자료대출실 (개가제)	대출가능	대출가능 마이폴더 부재도서신고
EM0164212	006.312 ㅂ194ㅍ c.2	자료대출실 (개가제)	대출가능	대출가능 마이폴더 부재도서신고

* Reservations are available in the borrowing book. To make reservations, Please click the reservation button

본문

서브메뉴

검색

New Books MORE

최근 3년간 통계입니다.

Detail Info.

해당 도서를 다른 이용자가 함께 대출한 도서

Related books

Related Popular Books

도서위치

QuickMenu