서브메뉴
검색
빅데이터 마이닝 : 하둡을 이용한 대용량 데이터 마이닝 기법
빅데이터 마이닝 : 하둡을 이용한 대용량 데이터 마이닝 기법
- 자료유형
- 동서단행본
- ISBN
- 9788960779532 94000 : \40000
- ISBN
- 9788960774469(set)
- 언어부호
- 본문언어 - kor, 원저작언어 - eng
- DDC
- 006.312-22
- 청구기호
- 006.312 L629mㅂ
- 저자명
- Leskovec, Jurij.
- 서명/저자
- 빅데이터 마이닝 : 하둡을 이용한 대용량 데이터 마이닝 기법 / 쥬어 레스코벡 ; 아난드 라자라만 ; 제프리 데이비드 울만 [공]지음 ; 박효균 ; 이미정 [공]옮김.
- 원서명
- [원표제]Mining of massive datasets((2nd ed.).)
- 발행사항
- 서울 : 에이콘, 2017.
- 형태사항
- 590 p. : 삽도 ; 25 cm.
- 총서명
- 에이콘 데이터 과학 시리즈.
- 주기사항
- 찾아보기: p. [579]-590.
- 서지주기
- 각 장마다 참고문헌 수록.
- 서지주기
- 설명적 각주 수록.
- 일반주제명
- Data mining
- 일반주제명
- Big data
- 기타저자
- Rajaraman, Anand.
- 기타저자
- Ullman, Jeffrey D. , 1942-
- 기타저자
- 박효군.
- 기타저자
- 이미정.
- 기타저자
- Jurij Leskovec.
- 기타저자
- Anand Rajaraman.
- 기타저자
- Jeffrey D. Ullman.
- 기타저자
- 레스코벡, 쥬어.
- 기타저자
- 라자라만, 아난드.
- 기타저자
- 울만, 제프리 데이비드.
- Control Number
- bwcl:99003
- 책소개
-
하둡을 이용한 대용량 데이터 마이닝 기법!
웹과 인터넷 상거래의 발달로 엄청난 규모의 데이터가 생성되고 있으며, 데이터 마이닝으로 이런 데이터에서 유용한 정보를 얻는 것이 가능하다. 이 책 『빅데이터 마이닝』은 데이터 마이닝 분야의 핵심 과제를 해결하고 대규모 데이터에 적용할 수 있는 현실적인 알고리즘에 초점을 맞추었다.
알고리즘의 자동 병렬처리를 위해 중요하게 사용되는 툴인 맵리듀스 프레임워크에 대한 논의로 책을 시작한다. 이후 지역성 기반 해싱 기법을 설명한다. 이는 대규모로 수집된 데이터에서 비슷한 객체를 일일이 비교하지 않고 찾아내기 위한 기본 지식 체계이기 때문에 알아둘 필요가 있다. 또한 정확한 처리를 위해 매우 빨리 입력되는 데이터를 마이닝하는 스트림 처리 알고리즘을 설명한다. 그리고 웹 체계화를 위한 페이지랭크 개념 및 이와 관련된 기법들을 다룬다.
나머지 장에서는 빈발 항목 집합 찾기와 클러스터링, 그리고 이 각각을 메인 메모리에 담을 수 없을 정도로 큰 데이터 관점에서 처리하는 방법, 그 외 전자상거래에서 중요하게 사용되는 추천 시스템 및 웹 광고에 대해 다룬다. 제2판에는 소셜 네트워크와 머신 러닝 및 차원 축소 기법이 포함됐다. 데이터베이스와 웹 기술을 선도하는 학자들이 쓴 이 책은 전공자들과 실무자들에게 유용한 책이 될 것이다.