서브메뉴

본문

혼자 공부하는 R 데이터 분석 (1:1 과외하듯 배우는 데이터 분석 자습서)
혼자 공부하는 R 데이터 분석 (1:1 과외하듯 배우는 데이터 분석 자습서)
저자 : 강전희^엄동란
출판사 : 한빛미디어
출판년 : 2022
ISBN : 9791162245019

책소개

- 혼자 해도 충분하다! 1:1 과외하듯 배우는 R 데이터 분석 자습서

이 책은 독학으로 R 데이터 분석을 배우는 입문자가 ‘꼭 필요한 내용을 제대로’ 학습할 수 있도록 구성했다. ‘무엇을’, ‘어떻게’ 학습해야 할지조차 모르는 입문자의 막연한 마음을 살펴, 과외 선생님이 알려주듯 친절하게, 그러나 핵심적인 내용만 콕콕 집어준다. 책의 첫 페이지를 펼쳐서 마지막 페이지를 덮을 때까지, 혼자서도 충분히 데이터 분석을 배울 수 있다는 자신감과 확신이 계속될 것이다!

- 30명의 베타리더 검증으로, ‘함께 만든’ 입문자 맞춤형 도서
30명의 베타리더와 함께 구성하여 입문자에게 맞는 난이도, 분량, 학습 요소 등을 적극 반영했다. 어려운 용어와 개념은 한 번 더 풀어쓰고, 복잡한 설명은 눈에 잘 들어오는 그림으로 풀어냈다. ‘혼자 공부해 본’ 여러 입문자의 초심과 눈높이가 책 곳곳에 반영된 것이 이 책의 가장 큰 장점이다.

4. 누구를 위한 책인가요?

● 프로그래밍도 통계도 처음 배우는 입문자
● R 언어로 데이터 분석을 시작하고 싶은 비전공자
● 학부에서 R 언어를 수강했지만, 여전히 아쉬움이 남아 있는 통계 전공자
● 학원이나 강의로 따로 데이터 분석을 배우기에는 시간과 여건이 부족한 직장인
● 데이터 분석에 관심 있는 일반인 누구나
[교보문고에서 제공한 정보입니다.]

출판사 서평

도서 특징

하나, ‘입문자 맞춤형 7단계 구성’을 따라가며 체계적으로 반복하는 탄탄한 학습 설계!
이 책은 R 데이터 분석의 핵심 내용을 7단계에 걸쳐 반복 학습하면서 자연스럽게 머릿속에 기억되도록 구성했다. 모든 절에서 [핵심 키워드]와 [시작하기 전에]를 통해 각 절의 주제에 대한 대표 개념을 워밍업한 후, 본격적인 데이터 분석 핵심 이론과 실습을 거쳐 마무리에서는 [핵심 포인트]와 [확인 문제]로 한 번에 복습한다. ‘혼자 공부할 수 있는’ 커리큘럼을 그대로 믿고 끝까지 따라가다 보면 프로그래밍과 통계 공부가 난생 처음인 R 데이터 분석 입문자도 무리 없이 책을 끝까지 마칠 수 있다!

둘, 직접 해보는 193개 ‘손코딩’으로 핵심 문법을 익히고, 데이터 분석 감각은 ‘4가지 프로젝트’로 제대로!
핵심 문법과 이론 설명은 두 눈과 머리로 술술 읽으며 넘어가고, R 코딩 감각은 직접 해보며 익힐 수 있는 193개의 엄선된 실습 예제를 담았다. 입문자에게 가장 필요한 반복 학습과 연습을 따라가다 보면 책에 담긴 코드를 ‘나의 코드’로 만들 수 있다. 마지막으로 R 언어로 공공 데이터 분석까지 직접 해보면 데이터 수집부터 분석 결과까지, 데이터 분석 전 과정을 몸소 익힐 수 있다.

셋, ‘혼공’의 힘을 실어줄 동영상 강의, 학습 사이트 지원
http://hongong.hanbit.co.kr
책으로만 학습하기엔 여전히 어려운 입문자를 위해 저자 직강 동영상도 지원한다. 또한 학습을 하며 궁금한 사항은 언제든지 질문할 수 있도록 학습 사이트를 제공한다. 저자가 질문 하나하나 직접 답변을 달아주고 있으며, R 언어 관련 최신 기술과 정보도 공유한다. 게다가 혼자 공부하고 싶지만 정작 혼자서는 자신 없는 사람들을 위해 혼공 학습단을 운영하여 마지막까지 포기하지 않고 독자가 완주할 수 있도록 최대한 지원한다.

넷, 언제 어디서든 가볍게 볼 수 있는 혼공 필수 [용어 노트] 제공
꼭 기억해야 할 핵심 개념과 용어만 따로 정리한 [용어 노트]를 제공한다. 처음 공부하는 사람들이 프로그래밍을 어려워하는 이유는 낯선 용어 때문이라는 것을 베타 리더를 통해 확인했다. 그러나 어려운 것이 아니라 익숙하지 않아서 헷갈리는 것이므로 용어나 개념이 잘 생각나지 않을 때는 언제든 부담 없이 용어 노트를 펼쳐보자. 제시된 용어 외에도 새로운 용어를 추가하면서 자신만의 용어 노트를 완성해가는 과정도 또 다른 재미가 될 것이다.

7. 먼저 읽은 베타리더들의 한 마디

● 쉽게 따라하며 데이터 분석에 다가가기 좋은 ‘데이터 분석의 알파벳’같은 도서입니다. - 베타리더 곽경태 님
● 데이터 분석을 물어볼 곳도 마땅치 않고 어떻게 시작해야 할지 난감할 때 이 책이 좋은 가이드가 됩니다. - 베타리더 박조은 님
● 이 책을 모두 읽었을 때 데이터 분석 관련한 전 과정을 경험할 수 있습니다. - 베타리더 손지민 님
● 실습 도중 발생하는 오류 해결 방법을 친절하게 설명하고 있어 오로지 학습에만 집중할 수 있습니다. - 베타리더 양민혁 님
● 설명을 읽고 바로 코딩하며 익히고, 매 절 마지막에 나오는 마무리로 개념을 확인할 수 있습니다. - 베타리더 이동희 님
● 초보자가 시작하기도 전에 좌절하지 않도록 개발 환경 설정, 용어, 코드를 상세하게 설명합니다. - 베타리더 임혁 님
[교보문고에서 제공한 정보입니다.]

목차정보

Chapter 01 빅데이터와 R
: R 언어를 소개하고 데이터 분석에서 왜 R 언어를 사용하는지 알아봅니다.
01-1 빅데이터와 R 언어
__빅데이터 시대
__R 언어를 소개합니다
__R의 장단점
[3가지 키워드로 정리하는 핵심 포인트]
[확인문제]

01-2 개발 환경 설치
__R 설치 파일 다운로드하기
__R 설치하기
__R 실행하기
__R 스튜디오 설치 파일 다운로드하기
__R 스튜디오 설치하기
[좀 더 알아보기] R 스튜디오 클라우드
[4가지 키워드로 정리하는 핵심 포인트]
[확인문제]

01-3 R 스튜디오 인터페이스와 환경 설정
__R 스튜디오 인터페이스
__환경 설정하기
__필수 작업 환경 설정하기
__스크립트 생성 및 저장하기
__코드 실행하기
[좀 더 알아보기] 도움말 사용하기
[5가지 키워드로 정리하는 핵심 포인트]
[확인문제]

Chapter 02 데이터 분석을 위한 기본 다지기
: 데이터 분석 과정을 알아보고 데이터란 무엇인지 살펴봅니다.
02-1 데이터 분석 과정
__1단계: 데이터 분석 설계하기
__2단계: 데이터 준비하기
__3단계: 데이터 가공하기
__4단계: 데이터 분석하기
__5단계: 결론 도출하기
[5가지 키워드로 정리하는 핵심 포인트]
[확인문제]

02-2 데이터의 생김새
__데이터 구조 간 관계 및 데이터 유형
__벡터
__범주형 자료
__행렬과 배열
__리스트와 데이터 프레임
[6가지 키워드로 정리하는 핵심 포인트]
[확인문제]

Chapter 03 R 프로그래밍 익히기
: R 프로그래밍 기본 문법을 알아봅니다.
03-1 변수와 함수
__변수 만들기
__함수 호출하기
__내장 함수 사용하기
__사용자 정의 함수 만들기
__return( ) 함수를 사용하는 이유
[5가지 키워드로 정리하는 핵심 포인트]
[확인문제]

03-2 패키지
__패키지 설치하기
__설치한 패키지 확인하기
__패키지 로드하기
__패키지 삭제하기
__주요 패키지 활용하기
[좀 더 알아보기] 필요한 패키지 찾아보기
[4가지 키워드로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수]
[확인문제]

03-3 조건문과 반복문
__연산자
__if-else 조건문
__반복문
[좀 더 알아보기] R 코드 오류 해결하기
[6가지 키워드로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수]
[확인문제]


Chapter 04 데이터 다루기
: 데이터를 수집하고 관측하고 탐색하여 데이터 특성을 파악하는 방법을 알아봅니다.
04-1 데이터 수집하기
__직접 데이터 입력하기
__외부 데이터 가져오기: TXT 파일
__외부 데이터 가져오기: CSV 파일
__외부 데이터 가져오기: 엑셀 파일
__외부 데이터 가져오기: XML, JSON 파일
[4가지 키워드로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수]
[확인문제]

04-2 데이터 관측하기
__데이터 전체 확인하기
__데이터 요약 확인하기
__기술통계량 확인하기
__데이터 빈도분석하기
[6가지 키워드로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수]
[확인문제]

04-3 데이터 탐색하기
__막대 그래프 그리기
__상자 그림 그리기
__히스토그램 그리기
__파이차트 그리기
__줄기 잎 그림 그리기
__산점도 그리기
[6가지 키워드로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수]
[확인문제]

Chapter 05 데이터 가공하기
: 데이터 분석이 수월하도록 데이터를 추출하고 정렬하거나 구조를 변형해 봅니다.
05-1 dplyr 패키지
__dplyr 패키지 설치 및 로드하기
__데이터 추출 및 정렬하기
__데이터 추가 및 중복 데이터 제거하기
__데이터 요약 및 샘플 추출하기
__파이프 연산자: %〉%
[2가지 키워드로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수]
[확인문제]

05-2 데이터 가공하기
__필요한 데이터 추출하기
__데이터 정렬하기
__데이터 요약하기
__데이터 결합하기
[4가지 키워드로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수]
[확인문제]

05-3 데이터 구조 변형하기
__넓은 모양 데이터를 긴 모양으로 바꾸기: melt( ) 함수
__긴 모양 데이터를 넓은 모양으로 바꾸기: cast( ) 함수
[좀 더 알아보기] cast( ) 함수로 데이터 요약하기
[2가지 키워드로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수]
[확인문제]

05-4 데이터 정제하기
__결측치 확인하기
__결측치 제외하기
__결측치 개수 확인하기
__결측치 제거하기
__결측치 대체하기
__이상치 확인하기
__이상치 처리하기
[3가지 키워드로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수]
[확인문제]

Chapter 06 데이터 시각화: ggplot2 패키지
: 데이터 시각화의 꽃, ggplot2 패키지를 활용하여 그래프를 그려봅니다.
06-1 그래프 그리기
__그래프 기본 틀 만들기: ggplot( ) 함수
__산점도 그리기: geom_point( ) 함수
__선 그래프 그리기: geom_line( ) 함수
__막대 그래프 그리기: geom_bar( ) 함수
__상자 그림 그리기: geom_boxplot( ) 함수
__히스토그램 그리기: geom_histogram( ) 함수
[좀 더 알아보기1] 연산자로 이어진 코드 줄 바꿈하기
[좀 더 알아보기2] 그래프에 그래프 더하기
[3가지 키워드로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수]
[확인문제]

06-2 그래프에 객체 추가하기
__사선 그리기: geom_abline( ) 함수
__평행선 그리기: geom_hline( ) 함수
__수직선 그리기: geom_vline( ) 함수
__레이블 입력하기: geom_text( ) 함수
__도형 및 화살표 넣기: annotate( ) 함수
[좀 더 알아보기1] 그래프와 축에 제목 추가하고 디자인 테마 적용하기
[좀 더 알아보기2] 절편과 기울기 구하기: 회귀분석
[3가지 키워드로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수]
[확인문제]

06-3 지도 시각화: ggmap 패키지
__구글 지도 API 키 발급받기
__ggmap 패키지로 구글 지도 활용하기
[3가지 키워드로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수]
[확인문제]

Chapter 07 프로젝트로 실력 다지기
: 앞에서 배운 내용을 바탕으로 공공 데이터를 직접 분석해 봅니다.
07-1 지역별 국내 휴양림 분포 비교하기
__데이터 수집: 전국 휴양림 표준 데이터 다운로드하기
__데이터 가공: 엑셀로 전처리하기
__데이터 분석: 빈도분석하고 시각화하기
[분석 단계로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수]
[확인문제]

07-2 해외 입국자 추이 확인하기
__데이터 수집: 입국 통계 데이터 다운로드하기
__데이터 가공(1): 엑셀로 전처리하기
__데이터 가공(2): 데이터 재구조화하기
__데이터 분석: 시각화하기
[분석 단계로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수]
[확인문제]

07-3 지도에서 코로나19 선별진료소 위치 확인하기
__데이터 수집: 코로나19 선별진료소 위치 정보 다운로드하기
__데이터 가공: 필요한 데이터 추출하기
__데이터 분석(1): 빈도분석하기
__데이터 분석(2): 지도 시각화하기
[분석 단계로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수]
[확인문제]

07-4 서울시 지역별 미세먼지 농도 차이 비교하기
__데이터 수집: 서울시 일별 미세먼지 데이터 다운로드하기
__데이터 가공(1): 엑셀로 전처리하기
__데이터 가공(2): 필요한 데이터 추출하기
__데이터 분석(1): 데이터 탐색하고 시각화하기
__데이터 분석(2): 가설 검정하기
[좀 더 알아보기] 세 개 이상의 집단 간 평균 차이 검정하기: 분산분석
[분석 단계로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수]
[확인문제]

Chapter 08 데이터 분석 보고서 공유하기
: 데이터 분석 결과를 효과적으로 공유할 수 있는 방법을 알아봅니다.
08-1 RPubs로 데이터 분석 결과 공유하기
__R 마크다운 문서 만들기
__R 마크다운 문서 미리보기
__R 마크다운 문서 저장 형식 변경하기
__RPubs에 배포하기
[좀 더 알아보기] R 마크다운 문법
[4가지 키워드로 정리하는 핵심 포인트]
[확인문제]

08-2 샤이니로 인터랙티브 웹 앱 만들기
__샤이니 파일 생성하기
__샤이니 앱 구조 살펴보기
__샤이니 앱 배포하기
__input 컨트롤 위젯
[4가지 키워드로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수]
[확인문제]

부록 A 데이터 분석 툴 소개
정답 및 해설
찾아보기
[교보문고에서 제공한 정보입니다.]

QuickMenu