서브메뉴
검색
빅데이터 분석을 위한 스칼라와 스파크 : 대용량 빅데이터 분석과 머신 러닝까지 활용하는
빅데이터 분석을 위한 스칼라와 스파크 : 대용량 빅데이터 분석과 머신 러닝까지 활용하는
- 자료유형
- 동서단행본
- ISBN
- 9791161752402 94000 : \50000
- ISBN
- 9788960772106(set)
- 언어부호
- 본문언어 - kor, 원저작언어 - eng
- DDC
- 006.312-23
- 청구기호
- 006.312 K18sㄱ
- 저자명
- 카림, 레자울
- 서명/저자
- 빅데이터 분석을 위한 스칼라와 스파크 : 대용량 빅데이터 분석과 머신 러닝까지 활용하는 / 레자울 카림 ; 스리다 알라 지음 ; 김용환 옮김
- 원서명
- [원표제]Scala and Spark for big data analytics : tame big data with Scala and Apache Spark!
- 발행사항
- 서울 : 에이콘, 2019
- 형태사항
- 1090 p. : 삽화 ; 24 cm
- 총서명
- Acorn+Packt technical book
- 주기사항
- 부록: A. Alluxio로 스파크의 처리 성능 높이기, B. 아파치 제플린에서 대화형 데이터 분석
- 주기사항
- 찾아보기: p. 1073-1090
- 주기사항
- 2019년도 대한민국 학술원 선정 교육부 우수학술도서
- 주기사항
- 대한민국 학술원 기증
- 일반주제명
- 빅데이터
- 일반주제명
- 데이터분석
- 일반주제명
- 데이터처리
- 기타저자
- 김용환
- 기타저자
- 알라, 스리다
- 통일총서명
- Acorn+Packt technical book
- 기타저자
- Karim, Rezaul
- 기타저자
- Alla, Sridhar
- 가격
- 기증\50000
- Control Number
- bwcl:113630
- 책소개
-
2019년 대한민국학술원 우수학술도서 선정도서
스파크를 이용해 데이터 분석 방법을 배우려는 사람에게 매우 유용한 책이다. 가장 먼저 스칼라를 소개하고, 스칼라 애플리케이션 개발에 필요한 객체지향 개념과 함수형 프로그래밍 개념을 설명한다. 스파크에 초점을 맞춰 RDD와 데이터 프레임을 사용한 기본 추상화를 다룬다.
그 다음 스파크 SQL, GraphX, 스파크 구조화 스트리밍을 사용해 구조화된 데이터와 구조화되지 않은 데이터를 분석하고 모니터링, 설정, 디버깅, 테스팅, 배포와 같은 고급 주제를 살펴본다. 또한 SparkR 및 PySpark API를 사용한 스파크 애플리케이션을 개발하는 방법, 아파치 제플린(Zeppelin)을 사용한 대화식 데이터 분석, Alluxio를 함께 사용해 인메모리 데이터를 처리하는 방법을 다룬다.
이 책을 다 살펴본 후, 스파크를 완벽하게 이해하고 풀 스택 데이터 분석을 수행할 수 있을 것이다. 이 책은 최신 2.3.2 버전을 기준으로 작성됐다. 기존의 원서에서 제공하는 코드의 오타와 호환성을 수정한 옮긴이의 github 저장소를 제공한다.
■ 스칼라의 객체지향 개념과 함수형 프로그래밍 개념 이해
■ 스칼라 컬렉션 API 이해
■ 스파크의 핵심 추상화를 알기 위해 RDD와 데이터 프레임으로 작업하기
■ 스파크 SQL과 GraphX를 사용해 구조 데이터와 구조화되지 않은 데이터 분석
■ 스파크 구조화 스트리밍을 사용해 확장 가능하고 내결함성 있는 스트리밍 애플리케이션 개발
■ 스파크 MLlib과 스파크 ML에서 많이 사용되는 알고리즘으로 예측 모델을 구축할 수 있는 분류, 회귀 분석, 차원 감소, 추천 시스템과 같은 머신 러닝 모범 사례
■ 방대한 양의 데이터를 클러스터링하는 클러스터링 모델 구축
■ 스파크 애플리케이션 튜닝, 디버깅, 모니터링 이해
■ 실제 독립형(Standalone), 메소스(Mesos), 얀(YARN), 쿠버네티스(Kubernetes) 모드의 클러스터에 스파크 애플리케이션 배포
스파크를 이용해 데이터 분석 방법을 배우려는 사람에게 매우 유용한 책이다. 스파크나 스칼라에 대한 지식은 없더라도 이전 프로그래밍 경험(특히 다른JVM 언어)이 있다면 스파크나 스칼라에 대한 개념을 이해하는 데 매우 유용하다.
스칼라는 지난 몇 년 동안 특히 데이터 과학과 분석 분야에서 꾸준히 증가하고 있다. 스파크는 스칼라로 작성됐고 분석 분야에서 널리 사용되고 있다. 이 책은 빅데이터를 잘 다룰 수 있는 스파크를 설명한다.