STEP1 데이터 분석 준비 & 기본
- 개발 환경 구축하기
- 파이썬 기본 내용
- 파이썬 핵심 라이브러리 소개 및 기능 설명
STEP2 데이터 정제와 응용
- 데이터 필터링/정렬 테크닉
- 결측값/이상값 확인 및 처리
STEP3 데이터 병합/그룹 연산
- 데이터 병합
- 테이블 형식 데이터 재배치/피벗
- groupby를 활용한 그룹별 요약 및 집계
- 피벗 테이블과 크로스탭 활용
STEP4 시계열 데이터 처리
- 날짜시간 데이터 타입
- 날짜시간 데이터 인덱스
STEP5 데이터 시각화
- 맷플롯립 기본 핵심
- 많이 활용되는 시본의 주요 그래프
STEP6 실전 연습
- EDA 실습: 넷플릭스 데이터셋
- 데이터 전처리 기법 적용 및 데이터 시각화 작업
통계 프로그램인 SPSS나 R 그리고 Matlab을 쓰다가 요즘에는 파이썬이 각광받아서 늦게나마 입문하기 위해 이 책을 펼쳤다. 저작자는 디자이너이자 UX/UI기획자로서 비전공자 비개발자인 나도 이해하기 쉽도록 깔끔한 디자인에 담백한 설명을 따라가게 한다.
다만, 데이터 분석의 완전 초심자가 읽기에는 개념적인 측면에서 더욱 친절할 수 있는 면도 있는데, 지면 할당이 그러니 미리 도입은 유투브 강의 같은 것을 추천하고, 이 책은 초중급자들을 위한 것이라 할 수 있다.
핵심 라이브러리는 넘파이, 판다스, 맷플롭립, 시본 패키지(또는 모듈)을 소개하고 있고, 후반부에 데이터 시각화 까지 다루는데 맷플롭립과 시본을 이용하여 설명한다.
아나콘다 주피터 노트북을 쓰기 힘든 사람은 구글 코랩을 추천해준다.
https://colab.research.google.com/
예제소스는 여기에 있다.
https://github.com/claryk0520/bumping-into-data-analysis
파이썬 목록들은 이곳을 참조하면 좋을 것이다.
라이브러리와 데이터셋 링크를 알려주지만 알파벳URL이어서, 요즘 트렌드에 맞게 QR코드도 삽입하여 용이하게 접속할 수 있다면 어떨까 하는 생각이 들었다.
또한, 실습내용에 대해 중구난방으로 예제를 뽑기 보다는 스토리텔링처럼 구성해서 긴밀하게 연결되어 잘 이용하는 순서에 따라서 배열한다면 기억(인풋)하거나 인출(아웃풋) 하기에도 쉽게 적용할 수 있을 것 같다.
입문자들은 옆에 놓고 한권 완독하면서 실습파일에 따라 공부하며, 필요할 때 발췌독을 하면서 그룹연산이나 시각화를 할 때 찾아보면 유용하게 쓰일 실용서이다.
'YES24 리뷰어클럽 서평단 자격으로 작성한 리뷰입니다.'
https://colab.research.google.com/
https://github.com/claryk0520/bumping-into-data-analysis
https://docs.python.org/3/