이 책은 저자가 말한 바와 같이 데이터 분석을 막 시작하려는 독자를 대상으로 한다. 파이썬의 많은 책들 중에서 엑셀 형식으로 파이썬 데이터를 사용하는 것은 엑셀에 적응한 방식을 그대로 차용해 파이썬을 배울 수 있어 더 용이한 학습이 가능하다.
데이터 분석은 빠른 수 적 계산 외에도 인터넷에서 무궁한 정보를 쉽게 찾는 것에 더해 데이터를 처리 하고 정리할 수 있기 때문에 많은 기업들이 선호한다.
작가는 이런 데이터 분석을 처음 접하는 독자들을 위해 무료로 사용이 가능한 아나콘다 배포판의 설치를 설명한다. 파이썬은 3.8버전 이상을 사용하고 있으며, 모든 코드의 실행은 주피터 노트북이라는 어플리케이션을 활용한다.
파이썬이 활용되는 범위는 다양하지만, 특히 비슷한 데이터 처리나 계산을 반복하는 작업의 활용이 많다. 파이썬의 함수를 따라 실행해 보면, 엑셀의 방식과 차이점을 비교하게 되는데, 엑셀에서 실행되는 함수의 방식이 함수를 선택하고 인수를 입력하는 방식이라면, 파이썬은 코드를 실행하는 실행문의 기본 구조를 알아야 하는 방식이다.
이 책은 파이썬의 라이브러리를 활용한 데이터 분석을 설명하지만, 파이썬의 기본 데이터 구조나 문법 등을 알지 못하면 중간에 막히는 부분들이 생긴다. 라이브러리는 처음 파이썬을 실행하고 조건을 확인하는데 참고하기 좋은 오픈 소스이니 넘파이 라이브러리와 판다스, 그리고 맥플롯립 라이브러리 등의 샘플을 확인하는 것도 좋은 공부가 될 것 같다.
책의 중간 부분에서는 데이터 정제와 응용에서 조건부 필터링, 결측값(실제 데이터에 값이 없는 부분) 을 시각화 하거나 대체하는 방법 등의 활용예제와 데이터 시각화를 위한 그래프 추출 등의 예제들이 있다.
엑셀에도 함수의 입력 방식의 순서가 있듯이 파이썬도 입력 방식의 순서가 있는데, 책에서는 추출된 부분을 눈에 띄게 표시해 학습을 하는데 용이하게 구성하고 있다. 이 부분은 이 책의 큰 장점이다. 책의 서두에는 작가의 블로그와 그 밖의 피드백을 받을 수 있는 이메일과 실습 예제가 있다. 처음 데이터 분석을 공부하려고 준비 중이라면 데이터 분석을 전공하지 않고도 충분히 데이터 관련 일을 하고 있는 저자의 이 책이 데이터 분석을 이해하는데 조금은 도움이 될 지 모르겠다.