콘텐츠 바로가기
본문 바로가기


블로그 전체검색
나도 하는 파이썬 데이터 분석

[도서] 나도 하는 파이썬 데이터 분석

김규석,김현정 저

내용 평점 5점

구성 평점 4점

수많은 데이터 분석 관련 쿡북들이 쏟아져 나오는 요즘이다. 그래서 양질의 책을 선별하는 것도 굉장히 어려워 졌다. 현재 뒤늦게 통계학 석사학위를 받는 나에게는 여러 고민들이 많은데 그 중 하나가 '실무적 분석방법론의 부재' 이다. 대학원에서 다루는 데이터 관련 예제들은 굉장히 일반적인 내용, 혹은 이론에 치우쳐져 있는 경우가 많다. 박사 진학에 큰 관심이 없는 나는 실제로 내 본업의 프로젝트에 어떻게 데이터 분석을 활용할 수 있을지가 더 궁금하다. 그래서 책을 고를 때 그 부분을 유심히 따지는데, 이 책에 실린 데이터와 예제들을 봤을 때 꽤나 놀랐다. 도시형 데이터를 사용하여 실제 생활에서 정말 필요하고 알고 싶은 문제들을 직접 구현해볼 수 있다는 게 너무 좋았다. 이 책을 몇번 정독하고 난 뒤에는 여기 나오는 프로젝트들을 기반으로 다음 학기부터 공모전 등에도 도전할 수 있지 않을까 하는 기대가 든다.

그렇다면 책의 구성은 어떨까? 책은 크게 두 부분으로 나뉘어 있는데, PYTHON 기초 문법 + 데이터 분석으로 보면 될 듯 하다. 1부는 Python을 모르는 입문자도 천천히 따라하면서 학습을 할 수 있도록 쉽게 설명이 되어 있고 앞서 말한 것 처럼 예제가 풍부하다. 무엇보다 Python은 C나 자바에 비해 진입장벽이 낮은 언어이니 프로그래밍을 아예 모르는 사람이라도 괜찮을 것이라 생각한다. 물론 쿡북의 한계는 항상 생각해야 한다. 진짜 실력을 기르기 위해서는 절대적 시간투여가 필수적이다. 이는 비단 프로그래밍에 국한된 사항은 아니므로 굳이 설명할 필요는 없을 것 같다.

 

2부인 데이터 분석 부분은 이 도서의 핵심파트로 데이터 분석에 유용하게 쓰이는 Python 라이브러리를 기본으로 간단한 예제를 통해서 적용을 알아본 다는 점이 특징이라 할 수 있다. 구성은 정형 데이터 분석, 비정형 테이터 분석, 크롤링, 상관 관계 분석, 회귀분석, 시계열 분석으로 나누어 설명하는데, 선형대수, 미적분 등 기초수학에 대한 배경지식이 없어도 이해하기 쉬운 문장으로 설명이 되어 있어 괜찮을 것이라 생각한다. 물론 본인이 고급 데이터 분석을 하고 싶다면 통계학 및 기초수학은 피할 수 없는 숙명이다.

책의 또다른 장점은 역시 Google Colab을 이용하여 프로그램 설치 없이 쉽게 따라살 있다는 점이다. 데이터의 양이 기하급수적으로 늘어난다면 코랩의 한계가 드러나겠지만, 교육용 서적을 마스터하는 정도라면 코랩의 기능은 부족함이 없다. 특히 프로그래밍 언어의 특성상 PC환경에 따라 설치 조차 어려운 경우가 많다. 많은 리뷰들이 예전 버전을 기초로 설명하고 있기에, 생각지도 못한 오류가 나올 때가 있기 때문이다. 그러나 이 책은 철저히 독자가 초보자라고 가정하고 설명하므로 설치부터 쉽게 시작할 수 있고, 데이터 분석도 실생활에서의 예제들을 통해 설명하여 진도를 나아간다. 결론적으로 데이터 분석을 처음 시작하는 사람들에게 입문서로 추천해 주고 싶은 책이다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 
취소

댓글쓰기

저장
덧글 작성
0/1,000

댓글 수 0

댓글쓰기
첫 댓글을 작성해주세요.

PYBLOGWEB2