본문

서브메뉴

빅데이터 분석을 위한 스칼라와 스파크 : 대용량 빅데이터 분석과 머신 러닝까지 활용하는
빅데이터 분석을 위한 스칼라와 스파크  : 대용량 빅데이터 분석과 머신 러닝까지 활용하는 / 레...
내용보기
빅데이터 분석을 위한 스칼라와 스파크 : 대용량 빅데이터 분석과 머신 러닝까지 활용하는
자료유형  
 동서단행본
ISBN  
9791161752402 94000 : \50000
ISBN  
9788960772106(set)
언어부호  
본문언어 - kor, 원저작언어 - eng
DDC  
006.312-23
청구기호  
006.312 K18sㄱ
저자명  
카림, 레자울
서명/저자  
빅데이터 분석을 위한 스칼라와 스파크 : 대용량 빅데이터 분석과 머신 러닝까지 활용하는 / 레자울 카림 ; 스리다 알라 지음 ; 김용환 옮김
원서명  
[원표제]Scala and Spark for big data analytics : tame big data with Scala and Apache Spark!
발행사항  
서울 : 에이콘, 2019
형태사항  
1090 p. : 삽화 ; 24 cm
총서명  
Acorn+Packt technical book
주기사항  
부록: A. Alluxio로 스파크의 처리 성능 높이기, B. 아파치 제플린에서 대화형 데이터 분석
주기사항  
찾아보기: p. 1073-1090
주기사항  
2019년도 대한민국 학술원 선정 교육부 우수학술도서
주기사항  
대한민국 학술원 기증
일반주제명  
빅데이터
일반주제명  
데이터분석
일반주제명  
데이터처리
기타저자  
김용환
기타저자  
알라, 스리다
통일총서명  
Acorn+Packt technical book
기타저자  
Karim, Rezaul
기타저자  
Alla, Sridhar
가격  
기증\50000
Control Number  
bwcl:113630
책소개  
2019년 대한민국학술원 우수학술도서 선정도서

스파크를 이용해 데이터 분석 방법을 배우려는 사람에게 매우 유용한 책이다. 가장 먼저 스칼라를 소개하고, 스칼라 애플리케이션 개발에 필요한 객체지향 개념과 함수형 프로그래밍 개념을 설명한다. 스파크에 초점을 맞춰 RDD와 데이터 프레임을 사용한 기본 추상화를 다룬다.
그 다음 스파크 SQL, GraphX, 스파크 구조화 스트리밍을 사용해 구조화된 데이터와 구조화되지 않은 데이터를 분석하고 모니터링, 설정, 디버깅, 테스팅, 배포와 같은 고급 주제를 살펴본다. 또한 SparkR 및 PySpark API를 사용한 스파크 애플리케이션을 개발하는 방법, 아파치 제플린(Zeppelin)을 사용한 대화식 데이터 분석, Alluxio를 함께 사용해 인메모리 데이터를 처리하는 방법을 다룬다.
이 책을 다 살펴본 후, 스파크를 완벽하게 이해하고 풀 스택 데이터 분석을 수행할 수 있을 것이다. 이 책은 최신 2.3.2 버전을 기준으로 작성됐다. 기존의 원서에서 제공하는 코드의 오타와 호환성을 수정한 옮긴이의 github 저장소를 제공한다.

■ 스칼라의 객체지향 개념과 함수형 프로그래밍 개념 이해
■ 스칼라 컬렉션 API 이해
■ 스파크의 핵심 추상화를 알기 위해 RDD와 데이터 프레임으로 작업하기
■ 스파크 SQL과 GraphX를 사용해 구조 데이터와 구조화되지 않은 데이터 분석
■ 스파크 구조화 스트리밍을 사용해 확장 가능하고 내결함성 있는 스트리밍 애플리케이션 개발
■ 스파크 MLlib과 스파크 ML에서 많이 사용되는 알고리즘으로 예측 모델을 구축할 수 있는 분류, 회귀 분석, 차원 감소, 추천 시스템과 같은 머신 러닝 모범 사례
■ 방대한 양의 데이터를 클러스터링하는 클러스터링 모델 구축
■ 스파크 애플리케이션 튜닝, 디버깅, 모니터링 이해
■ 실제 독립형(Standalone), 메소스(Mesos), 얀(YARN), 쿠버네티스(Kubernetes) 모드의 클러스터에 스파크 애플리케이션 배포

스파크를 이용해 데이터 분석 방법을 배우려는 사람에게 매우 유용한 책이다. 스파크나 스칼라에 대한 지식은 없더라도 이전 프로그래밍 경험(특히 다른JVM 언어)이 있다면 스파크나 스칼라에 대한 개념을 이해하는 데 매우 유용하다.
스칼라는 지난 몇 년 동안 특히 데이터 과학과 분석 분야에서 꾸준히 증가하고 있다. 스파크는 스칼라로 작성됐고 분석 분야에서 널리 사용되고 있다. 이 책은 빅데이터를 잘 다룰 수 있는 스파크를 설명한다.
신착도서 더보기
최근 3년간 통계입니다.

소장정보

  • 예약
  • 서가에 없는 책 신고
  • 나의폴더
소장자료
등록번호 청구기호 소장처 대출가능여부 대출정보
EM0156168 학술  006.312 K18sㄱ 자료대출실 (개가제) 대출가능 대출가능
마이폴더 부재도서신고
EM0156169 학술  006.312 K18sㄱ c.2 자료대출실 (개가제) 대출가능 대출가능
마이폴더 부재도서신고

* 대출중인 자료에 한하여 예약이 가능합니다. 예약을 원하시면 예약버튼을 클릭하십시오.

해당 도서를 다른 이용자가 함께 대출한 도서

관련도서

관련 인기도서

도서위치

QuickMenu