서브메뉴
검색
본문
Powered by NAVER OpenAPI
-
Do it! 쉽게 배우는 R 텍스트 마이닝 (단어 빈도 분석, 감정 분석, 의미망 분석부터 토핑 모델링까지 현장에서 사용하는 텍스트 분석 기법을 실전 예제로 익혀 보자!)
저자 : 김영우
출판사 : 이지스퍼블리싱
출판년 : 2021
ISBN : 9791163032298
책소개
4년간 R 데이터 분야 1위 도서 저자의 후속작 ‘텍스트 마이닝’ 도서 출간!
형태소 분석, 긍정·부정 분위기 분석, 연관 단어 분석, 시각화 모두 내 손으로!
봉준호 감독의 영화 [기생충]이 오스카상 4관왕을 수상한 사실은 이제 모두가 알고 있다! 그런데 온라인 댓글 분위기는 천차만별이었네? 이 영화가 대체 어땠길래? 당시 분위기를 분석하고 돌아볼 수는 없을까? 영화 평가가 긍정·부정적이었는지, 영화 자체의 평이 많은지 아니면 영화 외적 요소의 평이 많은지 궁금하다. 이제 김영우 선생님과 함께 R로 텍스트 마이닝을 해보자!
이 책은 직장인, 대학생, 연구자 누구나 쉽게 텍스트 분석을 할 수 있다. 한글 텍스트 분석은 물론 30종 넘는 다양한 그래프까지! 보고서에 바로 사용할 수 있는 다양한 결과물을 내 손으로 직접 만들 수 있다.
목차
__1장 단어 빈도 분석: 무엇을 강조했을까?
_01-1 텍스트 전처리
_01-2 토큰화하기
_01-3 단어 빈도 분석하기
__2장 형태소 분석기를 이용한 단어 빈도 분석
_02-1 형태소 분석
_02-2 명사 빈도 분석하기
_02-3 특정 단어가 사용된 문장 살펴보기
__3장 비교 분석: 무엇이 다를까?
_03-1 단어 빈도 비교하기
_03-2 오즈비 ? 상대적으로 중요한 단어 비교하기
_03-3 로그 오즈비로 단어 비교하기
_03-4 TF-IDF ? 여러 텍스트의 단어 비교하기
__4장 감정 분석: 어떤 마음으로 글을 썼을까?
_04-1 감정 사전 활용하기
_04-2 댓글 감정 분석하기
_04-3 감정 범주별 주요 단어 살펴보기
_04-4 감정 사전 수정하기
__5장 의미망 분석: 어떤 맥락에서 단어를 썼을까?
_05-1 동시 출현 단어 분석 ? Co-occurrence analysis
_05-2 동시 출현 네트워크 ? Co-occurrence network
_05-3 단어 간 상관 분석 ? Phi coefficient
_05-4 연이어 사용된 단어쌍 분석 ? n-gram
__6장 토픽 모델링: 어떤 주제로 글을 썼을까?
_06-1 토픽 모델링 개념 알아보기
_06-2 LDA 모델 만들기
_06-3 토픽별 주요 단어 살펴보기
_06-4 문서를 토픽별로 분류하기
_06-5 토픽 이름 짓기
_06-6 최적의 토픽 수 정하기
__7장 텍스트 마이닝 프로젝트: 타다 금지법 기사 댓글 분석
_07-1 주요 단어 살펴보기
_07-2 공감, 비공감 댓글 비교하기
_07-3 관심 댓글 비교하기
_07-4 단어 간 관계 살펴보기
_07-5 토픽 모델링
__8장 텍스트 마이닝 프로젝트: 차기 대선 주자 SNS 여론 분석
_08-1 SNS 언급량 추이 살펴보기
_08-2 SNS 이슈 살펴보기
_08-3 감정 단어 살펴보기
_08-4 감정 경향 살펴보기
_08-5 감정 추이 살펴보기
_08-6 긍정, 부정 트윗 단어 비교하기
__9장 텍스트를 효율적으로 분석하는 방법
_09-1 텍스트 데이터 수집하기
_09-2 텍스트 분석 품질 높이기
_09-3 완전 유용한 꿀팁