서브메뉴

본문

Pandas Cookbook (과학 연산, 시계열 분석, 파이썬을 이용한 시각화, 정돈된 데이터 만들기)
Pandas Cookbook (과학 연산, 시계열 분석, 파이썬을 이용한 시각화, 정돈된 데이터 만들기)
저자 : 시어도어 페트로우
출판사 : 에이콘출판
출판년 : 2018
ISBN : 9791161751252

책소개


Pandas가 가진 모든 기능을 친절한 예제와 설명, 실제 파이썬 코드를 통한 실습을 통해 설명한다. Pandas의 핵심인 DataFrame과 Series를 주축으로, 대부분의 함수, 메서드, 속성을 설명하고 각각이 가진 장단점과 메모리 사용량과 처리 시간도 비교해 준다. 또한 금융데이터에 있어 가장 중요한 시계열 자료를 처리하는 다양한 방법은 물론 SQL 데이터베이스와 연결하는 방법도 알려준다.

이와 함께 정돈된 데이터(Tidy data)에 대한 정의와 함께 데이터를 정돈하기 위한 방법과 절차에 대해 자세히 알아보고 matplotlib, 파이썬 plot, seaborn을 이용한 데이터 시각화에 대해 자세히 설명하고 각각의 장단점을 상세히 설명한다.

목차


1장. Pandas 기초

__소개
__DataFrame 해부
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__DataFrame의 주요 구성 요소 이용
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__데이터 형식 이해하기
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__데이터 단일 열을 Series로 선택하기
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__Series 메서드 호출
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__Series에 연산자 사용하기
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__Series 메서드를 함께 사용하기
____준비 단계
____방법
____작동 원리
____추가 사항
__인덱스를 의미 있게 만들기
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__열과 행 이름 다시 짓기
____준비 단계
____방법
____작동 원리
____추가 사항
__열의 생성과 삭제
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌


2장. DataFrame 필수 연산

__소개
__DataFrame에서 복수 열 선택
____준비 단계
____방법
____작동 원리
____추가 사항
__메서드를 사용한 열 선택
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__열 이름 일목요연하게 정렬하기
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__전체 DataFrame에 대한 연산
____준비 단계
____방법
____작동 원리
____추가 사항
__DataFrame 메서드 체인으로 묶기
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__DataFrame에서 연산자 이용
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__누락값 비교
____준비 단계
____방법
____작동 원리
____추가 사항
__DataFrame 연산의 방향 바꾸기
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__대학 캠퍼스의 다양성 지수 발견
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌


3장. 데이터 분석 시작

__소개
__데이터 분석 루틴 개발
____준비 단계
____방법
____작동 원리
____추가 사항
____데이터 딕셔너리
____참고문헌
__데이터 형식 변경을 통한 메모리 절약
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__최대에서 최소 선택
____준비 단계
____방법
____작동 원리
____추가 사항
__정렬에 의해 각 그룹의 최대 선택
____준비 단계
____방법
____작동 원리
____추가 사항
__sort_values를 사용해 nlargest를 복제
____준비 단계
____방법
____작동 원리
____추가 사항
__추적 지정 주문가 계산
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌


4장. 데이터의 부분 집합 선택

__소개
__Series 데이터 선택
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__DataFrame 행 선택
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__DataFrame의 행과 열을 동시에 선택하기
____준비 단계
____방법
____작동 원리
____추가 사항
__정수와 레이블을 동시에 사용해 데이터 선택
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__스칼라 더 빠르게 선택하기
____준비 단계
____방법
____작동 원리
____추가 사항
__게으른 행 슬라이스
____준비 단계
____방법
____작동 원리
____추가 사항
__사전 순서로 슬라이스
____준비 단계
____방법
____작동 원리
____추가 사항


5장. 불리언 인덱싱

__소개
__불리언 통계량 계산
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__다중 불리언 조건 구축
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__불리언 인덱싱을 사용한 필터링
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__인덱스를 사용한 불리언 인덱싱의 복제
____준비 단계
____방법
____작동 원리
____추가 사항
__고유한 정렬된 인덱스를 사용한 선택
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__주가 전망
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__SQL WHERE 절 해석
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__주식 시장 수익률의 정규성 검정
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__query 메서드를 사용한 불리언 인덱싱의 가독성 개선
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__where 메서드를 사용한 Series 보존
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__DataFrame 행 마스크
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__불리언, 정수 위치, 레이블을 이용한 선택
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌


6장. 인덱스 정렬

__소개
__인덱스 객체 관찰
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__카디션 곱 생성
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__인덱스 폭발
____준비 단계
____방법
____작동 원리
____추가 사항
__서로 다른 인덱스에 값 채우기
____준비 단계
____방법
____작동 원리
____추가 사항
__다른 DataFrames의 열 추가
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__각 열의 최댓값 부각하기
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__메서드 체인을 사용한 idxmax 복제
____준비 단계
____방법
____작동 원리
____추가 사항
__가장 흔한 최대값 찾기
____준비 단계
____방법
____작동 원리
____추가 사항


7장. 종합을 위한 그룹화, 필터링 그리고 변환

__소개
__종합에 대한 정의
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__복수 열과 함수를 사용한 그룹화와 집계
____준비 단계
____방법
____작동 원리
____추가 사항
__그룹화 후 MultiIndex 제거
____준비 단계
____방법
____작동 원리
____추가 사항
__종합 함수 커스터마이징
____준비 단계
____방법
____작동 원리
____추가 사항
__*args와 **kwargs를 사용한 종합 함수 커스터마이징
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__groupby 객체 조사
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__소수 인종이 다수인 주 찾기
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__체중 감량 내기를 통한 변환
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__apply를 이용한 주별 가중 평균 SAT 점수 계산
____준비 단계
____
____작동 원리
____추가 사항
____참고문헌
__연속 변수에 의한 그룹화
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__도시 간 총 비행 횟수 계산
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__최장 연속 정시 비행 찾기
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌


8장. 정돈된 형태로 데이터 재구성

__소개
__stack을 이용해 변숫값을 변수 이름으로 정돈
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__복수 변수 그룹을 동시에 스태킹
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__스택된 데이터 되돌리기
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__groupby 종합 후 Unstacking
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__groupby 종합으로 pivot_table 복제
____준비 단계
____방법
____작동 원리
____추가 사항
__쉬운 재구축을 위해 레벨 재명명
____준비 단계
____방법
____작동 원리
____추가 사항
__복수 변수가 열 이름으로 저장됐을 때의 정돈
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__복수 변수가 열값으로 저장된 경우의 정돈
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__같은 셀에 여러 값이 저장된 경우의 정돈
____준비 단계
____방법
____작동 원리
____추가 사항
__변수가 열 이름과 값에 저장된 경우의 정돈
____준비 단계
____방법
____작동 원리
____추가 사항
__동일 표에 복수 관측 단위가 저장된 경우의 정돈
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌


9장. Pandas 객체 합치기

__소개
__DataFrames에 새로운 행 추가
____준비 단계
____방법
____작동 원리
____추가 사항
__복수 DataFrames 연결
____준비 단계
____방법
____작동 원리
____추가 사항
__트럼프와 오바마 대통령 국정 수행 능력 평가 비교
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__concat, join, merge 사이의 차이점 이해하기
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__SQL 데이터베이스에 연결
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌


10장. 시계열 분석

__소개
__파이썬과 Pandas의 날짜 도구 차이 이해
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__시계열을 현명하게 분할하기
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__DatetimeIndex와만 작동하는 메서드 사용하기
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__주간 범죄 건수 알아보기
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__주별 범죄와 교통사고를 별도로 종합
____준비 단계
____방법
____작동 원리
____추가 사항
__범죄를 주별과 연도로 측정
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__DatetimeIndex에서 익명 함수를 사용한 그룹화
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__Timestamp와 다른 열을 이용한 그룹화
____준비 단계
____방법
____작동 원리
____추가 사항
__merge_asof를 사용해 범죄율이 20% 낮은 마지막 시기 찾기
____준비 단계
____방법
____작동 원리
____추가 사항


11장. Matplotlib, Pandas, Seaborn을 이용한 시각화

__소개
__matplotlib 다뤄 보기
____준비 단계
__matplotlib에 대한 객체지향 가이드
____방법
____작동 원리
____추가 사항
____참고문헌
__matplotlib를 이용한 데이터 시각화
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__Pandas를 이용한 도식화 기초
____준비 단계
____방법
____작동 원리
____추가 사항
____참고문헌
__비행 데이터셋 시각화
____준비 단계
____방법
____작동 원리
____참고문헌
__영역 그래프를 스태킹해 새로운 추세 발견
준비 단계
방법
작동 원리
추가 사항
__seaborn과 pandas의 차이점 이해
____준비 단계
____방법
____작동 원리
____참고문헌
__seaborn Grid를 사용한 다변량 분석
____준비 단계
____방법
____작동 원리
____추가 사항
__seaborn을 사용해 다이어몬드 데이터셋에 있는 심슨의 역설 발견
____준비 단계
____방법
____작동 원리
____추가 사항

QuickMenu