서브메뉴
검색
본문
Powered by NAVER OpenAPI
-
자바 데이터 분석 (자바로 배우는 데이터 분석과 빅데이터 처리, 데이터 시각화 방법)
저자 : 존 R. 허바드
출판사 : 에이콘출판
출판년 : 2019
ISBN : 9791161753355
책소개
자바를 사용해 다양한 데이터 분석 기법을 구현하는 방법을 알려주는 책이다. 자바를 사용한 기본적인 데이터 처리 방법과 데이터 시각화 방법, 다양한 통계치를 도출하는 프로그램 구현 방법이 예제로 쉽게 구현돼 있다. 또한 관계형 데이터베이스와 NoSQL 데이터베이스를 활용한 데이터 분석 방법 등 데이터베이스 기반의 분석 프로그래밍 방식도 다루고 있다. 일반적으로 데이터 분석 문제에서 많이 접근하는 회귀 분석, 분류 분석, 군집 분석 등을 아파치 커먼즈(Apache Commons)나 웨카(Weka) 같은 오픈소스를 활용해 구현하는 방법도 소개한다. 그 외에 추천 알고리즘, 빅데이터 분석 등의 이슈도 함께 다룬다.
목차
1장. 데이터 분석 개론
__데이터 분석의 기원
__과학적 방법
__보험학
__증기로 계산
__멋진 예시
__허먼 홀러리스
__에니악
__비지칼크
__데이터, 정보, 지식
__왜 자바인가?
__자바 통합 개발 환경
__요약
__2장. 데이터 처리
__데이터 유형
__변수
__데이터 요소와 데이터 셋
__데이터 요소와 데이터 셋
____널 값
__관계형 데이터베이스 테이블
____키 필드
____키-값 쌍
__해시 테이블
__파일 형식
____마이크로소프트 엑셀 데이터
____XML과 JSON 데이터
__테스트 데이터 셋 생성
____메타데이터
____데이터 클리닝
____데이터 스케일링
____데이터 필터링
____정렬
____병합
____해싱
__요약
3장. 데이터 시각화
__테이블과 그래프
____산점도
____선그래프
____막대그래프
____히스토그램
__시계열 데이터
__자바 구현체
__이동 평균
__데이터 순위
__도수 분포
__정규 분포
____사고 실험
__지수 분포
__자바 예제
__요약
4장. 통계
__기술 통계
__임의 추출
__확률 변수
__확률 분포
__누적 분포
__이항 분포
__다변량 분포
__조건부 확률
__확률적 이벤트의 독립
__분할표
__베이즈 정리
__상관계수와 공분산
__표준 정규 분포
__중심 극한 정리
__신뢰 구간
__가설 검정
__요약
5장. 관계형 데이터베이스
__관계 데이터 모델
__관계형 데이터베이스
__외래키
__관계형 데이터베이스 디자인
____데이터베이스 생성
____SQL 명령문
____데이터베이스에 데이터 입력
____데이터베이스 쿼리
____SQL 데이터 유형
____JDBC
____JDBC의 PreparedStatement 사용하기
____배치 처리
____데이터베이스 뷰
____서브쿼리
____테이블 인덱스
__요약
6장. 회귀 분석
__선형 회귀
____엑셀에서의 선형 회귀
____회귀 상관계수 계산
____분산 분석
____선형 회귀 자바 구현
____앤스콤 쿼텟
__다항식 회귀
____다중선형회귀분석
____아파치 커먼즈 구현
____곡선 적합
__요약
7장. 분류 분석
__의사 결정 트리
____의사결정 트리와 엔트로피와의 관계
____ID3 알고리즘
__웨카 플랫폼
____ARFF 파일 유형
____웨카를 사용한 자바 구현
__베이지안 분류기
____웨카를 사용한 자바 구현
____서포트 벡터 머신 알고리즘
__로지스틱 회귀
____K-최근접 이웃 알고리즘
____퍼지 분류 알고리즘
__요약
8장. 클러스터 분석
__거리 측정
__차원의 저주
__계층적 클러스터링
____웨카 구현
____K-평균 클러스터링
____K-중간점 클러스터링
____유사성 전파 클러스터링
__요약
9장. 추천 시스템
__유틸리티 행렬
__유사도 측정
__코사인 유사도
__간단한 추천 시스템
__아마존 아이템 기반 협업 필터링
__사용자 등급 구현
__거대 희소 행렬
__임의 접근 파일 사용
__넷플릭스 경진대회
__요약
10장. NoSQL 데이터베이스
__맵 데이터 구조
__SQL과 NoSQL
__몽고 데이터베이스 시스템
__도서관 데이터베이스
__몽고DB를 사용한 자바 개발
__지리 정보 데이터베이스를 위한 몽고DB 확장
__몽고DB에서의 인덱스
__왜 NoSQL인가? 왜 몽고DB인가?
__타 NoSQL 데이터베이스 시스템
__요약
11장. 빅데이터 분석
__확장, 데이터 스트라이핑, 샤딩
__구글 페이지랭크 알고리즘
__구글 맵 리듀스 프레임워크
__맵 리듀스 애플리케이션 예제
__워드카운트 예제
__확장성
__맵 리듀스를 사용한 행렬 곱
__몽고DB에서의 맵 리듀스
__아파치 하둡
__하둡 맵 리듀스
__요약
부록. 자바 도구
__명령창
__자바
__이클립스
__MySQL
__MySQL 워크벤치
__이클립스에서 MySQL 데이터베이스 접근
__몽고DB