콘텐츠 바로가기
본문 바로가기


블로그 전체검색
데이터 과학을 위한 파이썬과 R

[도서] 데이터 과학을 위한 파이썬과 R

릭 슈카페타,보이안 앙겔로프 공저/임혜연 역

내용 평점 4점

구성 평점 4점

시간이 너무나 빨리 지나갑니다. 어느덧 나는 한빛 리뷰어다!의 두 번째 책이 도착하였거든요. 이번 책 역시 제목을 보고 많은 기대를 했기에 도착하기만을 손꼽아 기다렸습니다. 하지만, 밑의 서평에 자세히 쓰겠지만서도 이번 책은  저의 기대를 완벽하게 충족시켜주진 못했습니다. 책의 잘못은 아니고요, 확실히 이런 얇은 가이드 라인에 가까운 책들은 주인을 잘 만나야 하는 것 같습니다. 얇다는 것은 축약했다는 것이고, 축약했다는 것은 독자가 이미 책이 다루는 내용에 어느정도 통달한 사람이라는 가정을 깔고 있습니다. 저는 그런 사람이 아니었기에 이 책이 제공하는 정보를 다 받아들이지 못한 것 같습니다. 저와 같은 불상사가 생기지 않게 하기 위해 책의 내용을 최대한 잘 정리하고, 정말로 필요한 독자들이 누군지 나름대로 정의해보고자 합니다.

<데이터 과학을 위한 Python과 R>은 R과 Python을 동시에 사용하며 두 언어의 장점을 활용하는 방법을 설명하는 책입니다. 이 책은 두 언어를 활용하는 방법에 대한 간단한 예제와 함께 실습을 제공하여 독자가 각 언어의 핵심 패키지의 장단점을 더 잘 이해할 수 있도록 합니다.

이 책의 시작은 파이썬이나 R을 아는 사람이라면 재미있게 읽을 수 있는 부분으로, 모든 작업을 선호하는 언어(R or 파이썬)로만 해야 한다는 편견을 깨고 두 언어를 함께 사용하는 방법을 알려줍니다. 또한 두 언어 모두에 대한 이론적, 실용적 접근 방식을 다루고 있어 각자의 상황에 맞춰 어떤 언어를 선택하고, 혹은 특정 언어를 연습하기 위해 어느정도의 시간과 노력을 투자해야 하는지를 알려주는 장이라고 보면 좋을 듯 해요.

2장 에서는 Python 사용자를 위한 R, R 사용자를 위한 Python의 환경 구분하여 설명하여 독자가 새로운 언어를 시작하는 데 도움을 줍니다. 이 섹션에서는 각 언어의 기본 기능 및 사용법에 대해 제한적이지만 그 중 유용한 가이드를 제공하는 부분도 있습니다.

3장 에서는 데이터 형식과 워크플로 컨텍스트로 나누어 각 언어가 강점을 가진 영역을 설명합니다. 파이썬은 이미지와 텍스트 처리 및 분석에 강하고, R은 시계열과 공간 정보에 능하다고 하네요. 워크플로우 맥락에서는 EDA와 보고서 작성은 R의 강점이고, 머신러닝, 딥러닝, 데이터 엔지니어링은 Python의 강점이라고 설명하고요.

마지막 4장은 R 진영의 레티큘레이트와 파이썬 진영의 rpy2 모듈 등 파이썬과 R 간의 상호 운용성을 구현하는 데 필요한 패키지를 소개합니다. 그런 다음 미국 농무부에서 제공하는 산불 데이터 세트를 사용하여 RStudio IDE에서 R과 Python을 올바르게 활용하는 방법을 보여줍니다. 얇은 책임에도 마지막에는 직접 연습할 수 있는 사례를 넣었으니 있을건 다 있다고 봐야겠죠....?

그러나 서두에 밝혔다시피 일부 독자분들은 이 책이 특정 측면에서 부족하다고 평가할 수 있을 것입니다. 나만의 느낌일 수도 있기에 다른 서평들도 살펴보았습니다. 역시 설명이 매우 요약적이고 친절하지 않기에, 이 책은 이미 R 또는 Python에 익숙한 데이터 과학 분야의 실무자에게 더 적합하다고 말씀하신 분들이 꽤 있었습니다. 또 책의 전체적인 방향이 R 사용자를 위한 Python과 Python 사용자를 위한 R에 맞춰져 있어 각 도구를 깊게 파고드는 목적이 있는 분들은 적합하지 않다는 의견도 있었네요.

물론 이러한 의견에도 불구하고 이 책은 R과 Python을 상호 운용하는 방법을 배우고자 하는 독자에게 꽤 유용할 겁니다. Python과 R을 함께 사용하는 방법에 대한 힌트를 제공하는 몇 안되는 책이기도 하고요. 두 언어의 강점을 활용하여 생산성을 더 높은 수준으로 끌어올릴 수 있는 방법이 궁금하신 분들이라면 충분히 도움이 될 것입니다.

나름의 결론을 내리자면, '데이터 과학을 위한 Python과 R'은 R과 Python을 함께 사용하는 방법을 배우고자 하는 모든 사람에게 나쁘지 않은 책입니다. 이 책에 단점이 없는 것은 아니지만, 두 언어를 함께 사용할 수 있는 실용적이고 이론적인 접근 방식을 제공하므로 읽어 볼 만한 가치가 있습니다. (물론 제가 지금까지 언급한 독자의 실력에 많이 좌우된다는 점을 꼭 잊지 마시길!)

 
취소

댓글쓰기

저장
덧글 작성
0/1,000

댓글 수 0

댓글쓰기
첫 댓글을 작성해주세요.

PYBLOGWEB2