서브메뉴
검색
본문
Powered by NAVER OpenAPI
-
오렌지3 데이터 분석 with 파이썬 (코딩 한 줄 몰라도 데이터 분석 OK!)
저자 : 임선집^채호창^곽랑주
출판사 : 루비페이퍼
출판년 : 2023
ISBN : 9791186710968
책소개
오렌지3로 배우고 파이썬·파이토치·트랜스포머로 복습하는
머신러닝·딥러닝 절대반지 원정대 프로젝트
세계적인 인기그룹 BTS의 모든 가사를 클릭 몇 번으로 분석할 수 있을까요? Covid-19 트윗 텍스트 분석을 코딩 몇 줄로 할 수 있나요? 가능합니다! 우리는 머신러닝/딥러닝 절대반지 원정대를 결성해서 머신러닝/딥러닝 작업을 놀랍게도 간결한 방식으로 실행합니다. 손이 많이 가는 데이터분석을 오렌지3로 쉽게 길을 내고, 파이썬 및 트랜스포머로 복습하여 탄탄한 실력을 다집니다.
목차
1장 절대반지: 오렌지3 vs 파이썬
__1.1 오렌지3는 쉬운데 파이썬은 어렵다?
__1.2 오렌지3와의 만남
__1.3 이 책의 구성
2장 머신러닝 원정대 출발: 오렌지3와 코랩 설치
__2.1 오렌지3 설치
__2.2 코랩 설치
3장 엘프의 도움: 오렌지3로 맛보는 이미지 및 텍스트 분석
__3.1 이미지 분석 맛보기
____Covid-19 이미지 데이터세트 준비
____오렌지3 부가 기능 설치
____이미지 분석
__3.2 텍스트 분석 맛보기
____BTS 노래 가사 데이터세트 준비
____텍스트 분석
4장 중간계 늪지: 비지도 학습
__4.2 군집 분석
____군집 분석이란?
____K-평균 군집
____오렌지3로 K-평균 군집
____파이썬으로 K-평균 군집
__4.3 연관 분석
____데이터세트 준비
____오렌지3로 연관 분석
____파이썬으로 연관 분석
5장 중간계 초원: 뇌졸중 예측 프로젝트
__5.1 데이터세트 및 데이터 전처리
____뇌졸중은 어떻게 발병하지?
____뇌졸중과 관련된 데이터를 모으자
____그전에도 뇌졸중이 발병한 적이 있을까?
____데이터 불러오기
____ID 변수 설정
____타깃 변수 생성
____기타 변수 데이터 처리
____결측값이 50% 초과인 변수 제거
____요약 통계 및 도수분포표 검토
____이상값 제거
____상관계수 검토
____시각화
____t-검정
__5.2 어떤 머신러닝 모델을 사용해 볼까?
____데이터 추가 처리
____데이터 분할 및 대체
__5.3 결정 트리 분류 모델
5.4 로지스틱 회귀 분류 모델
____더미 변수 생성
____로지스틱 회귀 모델
__5.5 사이킷런 신경망 분류 모델
__5.6 최근접 이웃 분류 모델(KNN)
__5.7 그래서 뇌졸중을 예방할 수 있을까?
6장 중간계 숲: 주택 가격 프로젝트
__6.1 데이터세트 및 데이터 전처리
____주택 가격은 어떻게 형성될까?
____주택 가격에 관련된 데이터를 구하자
____주변 주택 가격이 얼마지?
____데이터 처리 및 탐색적 자료 분석
____데이터 분할 및 대체
__6.2 트리 기반 분류 모델
____랜덤 포레스트 모델
____그레이디언트 부스팅 모델
__6.3 거리 기반 분류 모델
____라쏘(로지스틱 회귀) 모델
____신경망 모델
____SVM 모델
__6.4 연속 변수 회귀 모델
____회귀 모델과 릿지 모델
____XGBoost 모델
____LightGBM 모델
__6.5 스태킹 모델(앙상블)
7장 화산 기슭: 과일 품종 이미지 분석
__7.1 데이터세트 준비
__7.2 오렌지3 이미지 분석 Revisited
__7.3 허깅페이스 트랜스포머 이미지 분석
8장 화산 등반: Covid19 텍스트 분석
__8.1 데이터세트 준비
__8.2 오렌지3 텍스트 분석 Revisited
__8.3 허깅페이스 트랜스포머 텍스트 분석
9장 에필로그