서브메뉴

본문

R로 배우는 코딩 (빅데이터 분석의 첫걸음)
R로 배우는 코딩 (빅데이터 분석의 첫걸음)
저자 : 장용식|강희구
출판사 : 생능출판사
출판년 : 2018
ISBN : 9788970509389

책소개

코딩 학습을 하기 위해서는 어떤 언어를 선택하면 좋을까? IT 전공과 무관한 독자는 코딩 학습을 어떻게 시작하면 좋을까? 『R로 배우는 코딩』은 이 물음에 답하기 위해 저술되었다. 이제는 구문보다는 문제를 해결하는 절차 위주로 생각하고, 그에 맞는 라이브러리를 잘 활용하는 방법을 공부해야 할 때이다. 이러한 관점에서 R은 코딩 공부를 시작하기에 적합한 최고의 언어이다. 코딩을 처음 접하거나 빅데이터 분석에 관심 있는 초보자들에게 R로 배우는 코딩은 매우 유용한 책이 될 것이다.
[교보문고에서 제공한 정보입니다.]

출판사 서평

코딩 학습의 시작으로 왜 R을 공부하면 좋을까?

사회는 점점 복잡해지고 다양해지고 있다. 그와 동시에 컴퓨팅 비용은 낮아지고 있어 기업들은 그동안 축적한 데이터를 기반으로 효과적인 의사 결정을 위한 분석적 환경을 더욱 필요로 하고 있다. 이에 따라 데이터 분석의 최적 환경을 자랑하는 R이 급부상하고 있으며, 많은 이들에게 각광받고 있다. R은 다른 프로그래밍 언어에 비해 자료를 처리하는 데 탁월한 기능을 가지고 있다. 또한 많은 연구 및 개발자들이 제공하는 수천 개의 라이브러리를 활용할 수 있으며, 간단히 몇 줄의 코딩만으로 표, 차트, 지도 등 다양한 시각화 자료를 쉽게 만들어 낼 수 있다. 이러한 강력한 데이터 처리 능력과 쉬운 프로그래밍 환경으로 인해 IT와 무관한 비전공 독자라 하더라도 R로 쉽게 코딩을 배울 수 있다.
학습하기 최적의 구성, R로 배우는 코딩

첫째, 이 책은 초보자의 코딩 학습 시작을 위해 흥미 있고 쉬운 내용으로 구성하였다.
둘째, 차트, 애니메이션, 지도, 텍스트 마이닝, 공공 데이터, 네이버 오픈 API, 웹 스크래핑 등 실용적이고 쉬운 예제 중심의 내용으로 구성하였다.
셋째, 네트워크 분석, 시뮬레이션, 인공 신경망 등 실용적이고 고급 예제 중심의 내용으로 구성하였다.
다섯째, 구문보다는 절차 위주의 문제 해결 학습을 지향하는 내용으로 구성하였다.
여섯째, 개념 설명 → 예시와 학습목표 → 플로차트/R스크립트/실행/문법 → 실습과제 순서의 체계적인 학습 절차를 통한 최적의 주제별 내용으로 구성하였다.

R로 배우는 코딩의 학습 내용

1장 왜 R인가?
R은 누구든지 자유롭게 사용할 수 있는 오픈 소스로 통계, 기계 학습, 금융, 생물정보학, 그래픽스에 이르는 다양한 통계 패키지를 갖추고 있어 바로 응용할 수 있다. 또한 쉬운 설치와 실습이 가능하고 어떠한 데이터라도 분석해내며 그래프로 그려낼 수 있어, 컴퓨터 공학뿐 아니라 생명과학이나 인문학 등 여러 분야에서도 손쉽게 사용할 수 있다. 이 장에서는 이러한 R의 장점과 왜 배워야 하는지를 설명하고 있다.

2장 R 환경 구축
R은 오픈 소스이기 때문에 CRAN(www.r-project.org) 사이트에서 누구든지 자유롭게 내려받아 설치할 수 있다. R은 기본적으로 패키지들의 모음으로, 현재 CRAN에는 패키지 3,759개가 등록되어 있으며, 계속 개발되고 있다. 이 장에서는 이러한 R을 설치 방법에 따라 설치한다.

3장 데이터 구조의 이해와 코딩의 시작
R 코딩을 잘하기 위해서는 데이터 구조를 정확히 이해해야 한다. R은 벡터(vector), 배열(array), 리스트(list), 데이터 프레임(data frame) 등 다양한 데이터 구조를 지원하기 때문이다. 이러한 데이터 구조는 데이터 분석을 위해 매우 유용하다. 이 장에서 데이터 구조를 이해했다면 R 코딩의 날개를 단 것이나 다름없다.
4장 무조건 해 보기
R은 누구나 쉽게 할 수 있는 프로그래밍 언어이다. 앞에서 배운 R의 기본 내용을 바탕으로 차트로 나타내기, 애니메이션 출력하기, 단양팔경을 구글 맵 위에 올려놓기, 연설문 키워드 분석하기, 동전 던지기 시뮬레이션 등의 기초 내용을 미리 익혀 본다.

5장 차트 프로그래밍
차트는 데이터 분석 결과를 효과적으로 전달하기 위해 매우 유용하다. 플로차트는 알고리즘을 도식으로 표현한 것으로, 프로그램을 기록하고 설명하는 데에 또한 매우 유용하다. 이 장에서는 플로차트로 데이터를 알맞게 순서대로 정리한 후 R 프로그래밍으로 데이터를 분석한 차트를 출력한다.

6장 애니메이션
애니메이션의 개념을 이해하고, 카운트다운, 움직이는 차트, 움직이는 그림 등을 반복문으로 만들어 본다. 또한 실제 애니메이션 시나리오를 만들고 여러 개의 이미지 프레임을 만들어 실행한다.

7장 지도 활용하기
구글맵은 위성 사진, 지도, 360도 거리 전망, 실시간 교통정보, 두 지점 간의 최적 경로 등의 서비스를 제공한다. 이러한 구글맵을 활용하여 지도와 그래프를 출력하고, R의 ggmap을 활용하여 특정 지역의 지도, 충청북도의 명소인 단양팔경의 위치, 지진의 위치와 지진 강도 등을 표시한다.

8장 텍스트 마이닝과 워드 클라우드 활용
벡터 데이터를 이용하여 워드 클라우드를 연습하고, 통계청 데이터를 이용하여 행정구역별 인구수를 한눈에 볼 수 있는 워드 클라우드를 만든다. 또한 대통령 연설문의 워드 클라우드를 만들어 키워드를 비교 분석한다.

9장 공공 데이터 활용
공공데이터포털 사이트를 방문해 공공 데이터를 이용하는 방법을 알아본다. 공공데이터포털에서는 파일 데이터, 오픈 API, 시각화 등의 다양한 방식을 제공하고 있으며, 회원 가입만 하면 검색을 통해 원하는 공공 데이터를 빠르게 찾아볼 수 있다. 이 장에서는 특히 오픈 API를 활용하는 방법을 알아본다.

10장 네이버 오픈 API 활용
네이버는 네이버 오픈 API를 통해 다양한 정보를 제공하고 있다. 이러한 API를 활용하기 위해 API 키를 발급받는 절차와 API의 기본 사항을 알아본다. 그리고 실제로 네이버 블로그를 검색하고 워드 클라우드를 만들어 어떤 키워드들이 강조되었는지 비교한다.

11장 웹 스크래핑의 활용
웹 스크래핑을 활용하여 상품 카탈로그를 제작하거나 뉴스 기사, 블로그와 카페의 게시물, 회사의 프로필과 금융 데이터 등을 수집할 수 있다. 이 장에서는 상품 정보의 웹 스크래핑과 구글 검색의 웹 스크래핑을 경험한다.

12장 네트워크 분석
네트워크 분석에 간단히 사용할 수 있는 igraph를 이용하여 간단한 네트워크 유형과 페이스북 사용자 네트워크의 사회 연결망을 분석한다.

13장 시뮬레이션
동전 던지기 시뮬레이션과 난수를 이용하여 원주율을 계산하는 예로 사용되는 몬테카를로 시뮬레이션에 대해 알아본다.

14장 인공지능과 인공 신경망
인공지능과 기계 학습 분야에서 연구되는 학습 알고리즘의 하나인 인공 신경망에 대해 알아보고, 인공 신경망을 이용해 과거 주가 시계열 데이터로부터 학습 과정을 거쳐 주가를 예측하는 방법을 살펴본다.
[교보문고에서 제공한 정보입니다.]

목차정보

Chapter 1 왜 R인가?
1. 제4차 산업혁명의 도래
2. 이제는 소프트웨어 중심 사회
3. 프로그래밍 언어와 R
4. R 언어는 초보자도 흥미를 가질 수 있다

Chapter 2 R 환경 구축
1. R 활용 개념도
2. R 환경 구축
3. R의 패키지

Chapter 3 데이터 구조의 이해와 코딩의 시작
1. 데이터 구조의 이해
2. 벡터와 연산자
3. 배열과 행렬
4. 리스트
5. 데이터 프레임
6. 데이터 파일 읽기
7. 함수 만들기

Chapter 4 무조건 해 보기
1. 차트로 영업 실적 비교하기
2. 애니메이션으로 카운트 다운
3. 단양팔경을 구글 맵 위에
4. 워드 클라우드로 연설문 키워드 분석
5. 동전 던지기 시뮬레이션

Chapter 5 차트 프로그래밍
1. 단순한 차트의 종류
2. 파이 차트
3. 바 차트
4. 스택형/그룹형 바 차트
5. 일반적인 X-Y 플로팅(Generic X-Y Plotting)
6. 히스토그램
7. 박스 플롯
실습 과제: CDNow 거래 데이터의 차트 출력과 분포 파악

Chapter 6 애니메이션
1. 애니메이션 개요
2. 애니메이션 1: 카운트 다운
3. 애니메이션 2: 움직이는 차트
4. 애니메이션 3: 움직이는 그림
실습 과제: 애니메이션 실습

Chapter 7 지도 활용하기
1. 구글맵과 Google Map API
2. 구글맵 다루기
3. 여러 지역(단양팔경)을 지도 위에 표시하기
4. 지진 위치 출력
실습 과제: ‘이디야’ 매장 안내 지도 만들기

Chapter 8 텍스트 마이닝과 워드 클라우드 활용
1. 텍스트 마이닝과 워드 클라우드
2. 지역별 인구수의 변화에 대한 워드 클라우드 출력
3. 연설문 키워드 분석과 비교
실습 과제: 연설문의 워드 클라우드 출력과 분석

Chapter 9 공공 데이터 활용
1. 공공데이터포털
2. 오픈 API 활용 절차
3. 시내버스의 실시간 위치 조회를 위한 오픈 API 활용
실습 과제 1: 버스 차량 번호 출력
실습 과제 2: 관심 있는 공공 데이터 활용

Chapter 10 네이버 오픈 API 활용
1. 네이버 오픈 API 개요
2. 네이버 API 키 발급받기
3. 네이버 API 기본 사항
4. ‘여름 추천 요리’ 분석을 위한 네이버 블로그 검색
실습 과제: 네이버 뉴스 검색

Chapter 11 웹 스크래핑의 활용
1. 웹 스크래핑 개요
2. 특정 웹 페이지의 상품 정보 스크래핑
3. 다수 웹 페이지의 상품 정보 스크래핑
실습 과제 1: 유튜브의 동영상 목록 스크래핑(첫 번째 페이지)
실습 과제 2: 유튜브의 동영상 목록 스크래핑(다수 페이지)

Chapter 12 네트워크 분석
1. 네트워크 분석의 개요
2. 네트워크 분석 지표
3. 페이스북 사용자 네트워크 분석
실습 과제: 천체물리학 논문 연구 협업 네트워크 분석

Chapter 13 시뮬레이션
1. 시뮬레이션 개요
2. 동전 던지기
3. 몬테카를로 시뮬레이션에 의한 원주율 구하기
실습 과제: 주사위 던지기

Chapter 14 인공신경망
1. 인공신경망 개요
2. 시계열 데이터와 인공신경망 모형
3. 인공신경망을 이용한 주가 예측
실습 과제: 인공신경망을 이용한 환율 예측
[교보문고에서 제공한 정보입니다.]

QuickMenu