서브메뉴

본문

R를 이용한 텍스트 마이닝 (개정판)
R를 이용한 텍스트 마이닝 (개정판)
저자 : 백영민
출판사 : 한울(한울아카데미)
출판년 : 2020
ISBN : 9788946072190

책소개


R를 이용한 텍스트 마이닝 기법의
변화와 발전에 맞춘 2020 개정판


2017년 가을 첫선을 보인 후 독자의 사랑을 받아온 『R를 이용한 텍스트 마이닝』의 개정판이 나왔다. 2년 반이라는 길다면 길고 짧다면 짧은 시간동안 R을 활용한 기법은 많은 변화와 발전이 있었다. 기법상의 변화 뿐 아니라 우리를 둘러싼 텍스트 환경의 판도도 변화했다. 웹보다는 모바일 플랫폼이 대세가 된 것이다. 저자는 이러한 변화에 발맞추고 학계와 독자들의 피드백을 반영해 424쪽 개정판을 내놓았다.

이 책에서 다루는 여러 기법들은 학문적 신뢰성이 검증되었으며 현재 언론학, 정치학, 사회학, 컴퓨터공학, 통계학 등의 학술논문에서 소개되거나 해당 분과의 학술적 주장을 뒷받침하는 자료로서 효용을 인정받고 있다. 또한 예제를 통해 독자가 직접 실습해 볼 수 있도록 구성되어 있다. 저자는 자신의 연구 데이터를 분석하기 위한 도구로서 R을 다루어 왔고 여론조사 및 수용자 조사, 계량적 연구 방법에 주로 관심을 두고 연구해 왔다. 이와 함께 수년간 R를 이용한 텍스트 분석 워크숍을 진행한 저자의 경험이 이 책에 그대로 녹아 있다.

목차


1부 텍스트 데이터란 무엇인가
01 텍스트를 데이터로 파악하기

2부 텍스트 데이터 처리
01 텍스트 분석을 위한 기초적 R 함수
02 텍스트 분석을 위한 R의 베이스 함수
03 텍스트 분석을 위한 stringr 패키지 함수
04 말뭉치 텍스트 데이터 사전처리
05 한국어 텍스트 데이터 처리
06 품사분석

3부 텍스트 데이터 분석 및 결과 제시
01 텍스트 데이터에 대한 기술통계분석
02 토픽모형
03 감정분석

4부 마무리
01 RSelenium, rvest 패키지를 활용한 온라인 데이터 수집
02 맺음말

별첨 자료
01 자바 설치 방법
02 잠재토픽 개수 선정

QuickMenu