서브메뉴
검색
파이썬 텍스트 마이닝 완벽 가이드 : 자연어 처리 기초부터 딥러닝 기반 BERT 모델까지
파이썬 텍스트 마이닝 완벽 가이드 : 자연어 처리 기초부터 딥러닝 기반 BERT 모델까지
- 자료유형
- 동서단행본
- ISBN
- 9791158393007 93500
- DDC
- 006.312-23
- 청구기호
- 006.312 ㅂ194ㅍ
- 저자명
- 박상언
- 서명/저자
- 파이썬 텍스트 마이닝 완벽 가이드 : 자연어 처리 기초부터 딥러닝 기반 BERT 모델까지 / 박상언, 강주영, 정석찬 지음
- 발행사항
- 파주 : 위키북스, 2022
- 형태사항
- xviii, 322 p. : 삽도 ; 24 cm
- 총서명
- 데이터 사이언스 시리즈 = = DS ; 077
- 서지주기
- 찾아보기: p. 318-322
- 기타저자
- 강주영
- 기타저자
- 정석찬
- 가격
- \28000
- Control Number
- bwcl:119574
- 책소개
-
텍스트 마이닝에는 자연어 처리, 통계, 딥러닝 기법에 대해 많은 지식이 필요하지만, 이론적인 내용에 얽매이다 보면 정작 구현은 너무 먼 이야기가 되어 버리기 쉽다.
이 책에서는 실무에 바로 적용할 수 있는 실전적인 예제를 중심으로 텍스트 마이닝을 설명한다. 특히 초보자를 위해 텍스트 전처리 과정의 개념과 다양하고 상세한 활용방법을 기초부터 설명한다. 문서 분류와 감성 분석 같은 텍스트 마이닝 작업을 대상으로 다양한 머신러닝 기법을 사용하는 예를 보여주며, 차원을 축소하고 결과를 시각화하는 방법, 토픽 모델링을 수행하고 토픽 트렌드를 구해서 시각화하는 방법을 설명한다.
기본적인 딥러닝 기법을 이용한 문서 분류 외에, 최근 많이 사용되는 BERT를 이용한 미세조정학습까지 포함한다. 또한 한국어 문서 분석에 자신을 갖도록 대부분의 장에 관련 예제를 충분히 다뤘다.
★ 이 책에서 다루는 내용 ★
◎ 토큰화, 어간 추출, 표제어 추출, 불용어 처리, 품사 태깅과 같은 텍스트 전처리 기법
◎ 단어 빈도 그래프, 워드 클라우드 그리기
◎ 카운트 벡터, TF-IDF 벡터로 문서를 변환하고, 문서 간 유사도 구하기
◎ 다양한 머신러닝/딥러닝 기법으로 문서 분류와 감성 분석 수행
◎ KoNLPy를 이용해 한국어 문서를 변환하고 다양한 머신러닝 알고리즘으로 분석
◎ 문서 벡터의 차원 축소, LDA 토픽 모델링, 토픽 트렌드를 구하고 시각화
◎ Word2Vec, ELMo와 같은 워드 임베딩 기법과 Doc2Vec의 이해
◎ BERT의 이해와 활용, 파이토치를 이용한 미세조정 학습의 실습, 한국어 문서에 대한 BERT 사용법 실습