서브메뉴

본문

빅데이터 분석의 첫걸음 R코딩
빅데이터 분석의 첫걸음 R코딩
저자 : 장용식|최진호
출판사 : 생능출판사
출판년 : 2020
ISBN : 9788970503974

책소개


R과 함께 배우는 빅데이터 분석 입문서

『빅데이터 분석의 첫걸음 R코딩』은 R을 통해 코딩에 대한 자신감을 높이고 데이터 분석에 대한 흥미를 가질 수 있도록 하기 위해 저술되었다. R은 우리에게 새로운 기회가 될 수 있다. 통계 패키지로 출발한 R은 SAS, MATLAB, SPSS 보다 더 선호되고 있으며, 범용 프로그래밍 언어인 Java, C/C++, Python 못지 않게 인기가 높다. R은 일반적인 데이터 처리를 위한 뛰어난 기능이 있고, 간단히한두 줄의 코딩으로 표, 차트, 지도 등 다양한 시각화 자료를 쉽게 만들어 내며, 웹을 통한 정보 추출과 인공지능구현을 위한 손쉬운 기능 등을 제공하고 있어 배울수록 흥미가 깊어질 것이다. 이 책은 처음 데이터를 다루는 입문자를 위해 R의 기초 문법과 여러 흥미로운 주제를 쉽게 이해할 수 있도록 구성하였다.

목차


Chapter 1 데이터로 움직이는 사회와 R
1.1 산업혁명
1.2 데이터로 움직이는 사회
1.3 데이터분석 도구, R

Chapter 2 R 개발환경
2.1 R 개발환경
2.2 R 설치와 시작
2.3 RStudio 설치와 시작
2.4 패키지와 라이브러리

Chapter 3 데이터 구조의 이해
3.1 데이터 구조의 이해
3.2 벡터와 연산자
3.4 배열과 행렬
3.5 리스트
3.6 데이터 프레임
3.7 데이터 파일 읽기
3.8 함수

Chapter 4 무조건 해보기
4.1 X-Y 플로팅 차트로 보는 지역별 미세먼지 현황
4.2 워드 클라우드로 보는 지역별 미세먼지 현황
4.3 애니매이션: 바람개비 돌리기
4.4 웹스크래핑: 공공데이터 포털의 API 목록 출력
4.5 동전 던지기 시뮬레이션

Chapter 5 차트 프로그래밍
5.1 단순한 차트의 유형
5.2 줄기-잎 그림
5.3 파이 차트
5.4 바 차트
5.5 X-Y 플로팅
5.5 X-Y 플로팅
5.6 히스토그램
5.7 박스 플롯
실습 과제 1: CDNow 거래 데이터를 이용한 분포 분석
실습 과제 2: 강의 길이에 대한 분포 분석

Chapter 6 애니메이션
6.1 애니메이션 개요
6.2 카운트 다운
6.3 랜덤 막대그래프
6.4 동전 던지기 확률의 변화 차트
6.5 룰렛 돌리기
6.6 라이언 킹
실습 과제 1: 수열 출력: 1~100 사이의 3의 배수 합
실습 과제 2: 당구공 굴리기

Chapter 7 지도 활용하기
7.1 구글맵과 개요
7.2 구글맵 API키 신청
7.3 구글맵 출력
7.4 단양팔경을 지도 위에
7.5 지진 발생 지역 분포
실습 과제: 미세 먼지 분포

Chapter 8 웹스크래핑
8.1 웹스크래핑 개요
8.2 문자 추출을 위한 DOM 구조의 이해
8.3 공공데이터포탈의 목록 추출(단일 페이지)
8.4 공공데이터포탈의 목록 추출(다수 페이지)
실습 과제: 유튜브의 동영상 목록 추출

Chapter 9 공공 데이터 활용
9.1 공공데이터 포탈 개요
9.2 오픈 API 인증키 신청: 미세먼지 정보
9.3 미세먼지 농도의 시간대별 변화: 막대 그래프
9.4 지역별 미세먼지 농도 비교: 지도
실습 과제 1: 특정 지역의 시간대별 미세먼지 농도의 변화
실습 과제 2: 특정 시간대의 지역별 초미세먼지 농도 비교

Chapter 10 네이버 오픈 API 활용
10.1 네이버 오픈 API 개요
10.2 네이버 정보검색 API키 발급 받기
10.3 네이버 오픈 API 기본 사항
10.4 뉴스 검색: “인공지능” 키워드
실습 과제: 네이버 블로그 검색

Chapter 11 네트워크 분석
11.1 네트워크 분석의 개요
11.2 네트워크 분석 지표
11.3 네트워크 지표 분석
11.4 페이스북 사용자 네트워크 분석
실습 과제 : 천체물리학자의 협업네트워크 분석

Chapter 12 시뮬레이션
12.1 시뮬레이션 개요
12.2 표본추출과 난수
12.3 동전 던지기
12.4 몬테카를로 시뮬레이션에 의한 원주율 구하기
12.5 회귀선 구하기
실습 과제 1: 주사위 던지기
실습 과제 2: 시물레이션과 통계적 방법의 회귀선 비교
개정 R 프로그래밍 책1.indb 10 2020-03-25 오후 2:54:

Chapter 13 인공신경망과 딥러닝의 이해
13.1 인공지능과 인공신경망 개요
13.2 인공신경망 구성과 학습
13.3 주택 가격 예측(회귀문제)
13.4 붓꽃 종의 분류(분류문제)
실습 과제 1: 가격 예측(입력 노드 수의 변경)
실습 과제 2: 붓꽃 종의 분류(은닉층 노드 수의 변경)

부록
1 R 설치
2 RStudio 설치
참고문헌
찾아보기

QuickMenu