콘텐츠 바로가기
본문 바로가기


블로그 전체검색
파이썬 머신러닝 판다스 데이터 분석

[도서] 파이썬 머신러닝 판다스 데이터 분석

오승환 저

내용 평점 5점

구성 평점 5점

세상을 움직이고 변화시키는 원동력은 다양하지만 21세기의 4차 산업혁명의 중심에는 IT가 있습니다. 과거에는 오피스 프로그램이나 자신의 업무와 관련된 시스템 정도만 이해해도 충분히 버틸 만 했지만, 오늘날 비즈니스 현업 사용자는 IT를 모르고서는 할 수 있는 업무는 그리 많지 않습니다. 


특히 지난 7월 4일, 3년 만에 한국을 방문한 손정의 소프트뱅크 회장이 문재인 대통령을 만나 “앞으로 한국이 집중해야 할 것은 첫째도 인공지능(AI), 둘째도 인공지능, 셋째도 인공지능”라고 강조했다는 것에서 알 수 있듯이 앞으로 인공지능 기술이 정보의 전달 체계를 비롯한 우리 삶의 패러다임을 바꿀 것이 분명합니다. 이처럼 4차 산업혁명의 핵심이자 차세대를 이끌 인공지능은 애플리케이션 개발자에게 새롭게 열리는 가능성의 세계이기도 합니다.


머신러닝 또는 딥러닝을 활용함으로써 훨씬 더 정밀한 사용자 프로필과 개인화, 추천이 가능하며, 스마트 검색, 음성 인터페이스 또는 지능적인 가상비서를 구현하거나 그 외의 다양한 방법으로 앱을 개선할 수 있다. 심지어 보고 듣고 반응하는 애플리케이션도 만들 수 있습니다. 이에 필요한 대표적인 프로그래밍 언어는 요즘 뜨는 언어인 파이썬(Python)입니다. 




특히 파이썬은 인공지능에 있어 탁월한 언어이며, 특히 파이썬의 라이브러리는 다른 언어에서는 따라올 수 없을 정도로 독보적이라 합니다. 실제로 개발자들의 지식인이라 불리는 '스택오버플로(StackOverflow)'는 2019년 개발자 대상 설문조사를 통해 파이썬이 가장 인기있는 프로그래밍 언어라는 조사 결과를 내놓았고, 앱테스팅 업체 글로벌앱테스팅이 유튜브에 게재한 영상을 보면 스택오버플로 전체 질문가운데 10년 전인 2008년 11월 당시 자바스크립트의 비중은 4.7%였고 파이썬은 3.5%이었지만, 10년만인 2018년 11월 파이썬이 태그된 질문이 11.3%를 차지하면서 자바스크립트가 태그된 질문 10.2% 비중을 처음 넘어섰다고 합니다.


그렇다면 파이썬이 왜 이렇게 각광 받는 것일까요? 한마디로 대부분의 프로그래밍 언어가 하는 일을 파이썬은 쉽고 깔끔하게 처리하기 때문입니다. 대표적인 몇 가지 예를 들어 보면, 먼저 파이썬은 운영체제(윈도우, 리눅스 등)의 시스템 명령어를 사용할 수 있는 각종 도구를 갖추고 있기 때문에 이를 바탕으로 갖가지 시스템 유틸리티를 만드는 데 유리합니다. 파이썬은 GUI 프로그래밍을 위한 도구들이 잘 갖추어져 있어 GUI 프로그램을 만들기 쉽다고 합니다. 또 파이썬은  다른 언어와 잘 어울려 결합해서 사용할 수 있는 접착(glue) 언어로 C나 C++로 만든 프로그램을 파이썬에서 사용할 수 있으며, 파이썬으로 만든 프로그램 역시 C나 C++에서 사용할 수 있습니다.


특히 이 책에서는 파이썬으로 만든 판다스(Pandas) 모듈을 사용하여 데이터 분석을 더 쉽고 효과적으로 할 수 있게 설명하고 있습니다. 데이터 분석을 할 때 아직까지는 데이터 분석에 특화된 ‘R’이라는 언어를 많이 사용하고 있지만, 판다스가 등장한 이후로 파이썬을 사용하는 경우가 점점 증가하고 있다고 합니다.


판다스 라이브러리는 데이터를 수집하고 정리하는데 최적화된 도구로, 데이터 분석에 필요한 두 가지 종류의 기본 데이터 시리즈와 데이터프레임을 제공합니다. 오픈소스라는 장점도 갖고 있습니다. 또한 배우기 쉬운 파이썬을 기반으로 하기 때문에 전공자가 아니라도 쉽게 따라하며 배우는 것이 가능합니다. 이 책에서는 파이썬과 판다스를 활용하여 데이터의 입출력부터 머신러닝 데이터 분석까지, 필수 라이브러리를 소개하고 설치부터 예제 코드를 따라 하면서 자연스럽게 익숙해지도록 안내하고 있는 책입니다.




여기서 머신러닝은 1959년 아서 사무엘에 의해 “컴퓨터에 명시적인 프로그램 없이 배울 수 있는 능력을 부여하는 연구 분야”라고 정의된, 데이터를 사용해 컴퓨터가 스스로 학습하여 새로운 지식을 얻어내는 것을 의미합니다. 최근 인터넷을 통하여 엄청난 양의 데이터가 쏟아지게 되자 그 활용이 가속화되었습니다. 사실 이 책의 이 책의 발행 1년 전에 파이썬을 배우기 시작한 저자는 독학으로 공부한 만큼 여러 시행착오를 겪으며 초보자의 입장을 이해해서 말 그대로 이 책에서 제시하는 대로 따라만 하면 쉽게 프로그램에 익숙해 주는 방식으로 설명하고 있습니다. 


특히 이 책에 실린 학습에 필요한 예제 코드와 자료 파일은 정보문화사 홈페이지(INFOPUB.CO.KR) 자료실에서 다운로드할 수 있고, 저자의 블로그(OKKAM76.BLOG.ME)에 질의응답 게시판을 운영하고 있어서 궁금한 점이나 책과 관련된 요청사항을 피드백할 수 있다고 합니다. 4차 혁명시대의 필수 도구인 파이썬과 판다스를 쉽게 정복할 수 있는 좋은 기회를 주는 책입니다.


리뷰어스클럽으로부터 도서만을 제공받아 주관적으로 작성한 서평입니다


 
취소

댓글쓰기

저장
덧글 작성
0/1,000

댓글 수 0

댓글쓰기
첫 댓글을 작성해주세요.

PRIDE1