콘텐츠 바로가기
본문 바로가기


블로그 전체검색
실전 시계열 분석

[도서] 실전 시계열 분석

에일린 닐슨 저/박찬성 역

내용 평점 4점

구성 평점 5점

머신 러닝을 다룰 때는 무엇보다 많은 데이터를 다루게 됩니다. 오브젝트 인식, 음성 인식, 추천 시스템 등의 잘 알려진 머신 러닝에서는 하나의 대상을 기준으로 한 데이터를 이용하는 것을 보게 됩니다. 그런데, 시간적인 연속성, 지속성 등의 포함된 데이터는 어떻게 다루어서 처리를 할까라는 의문이 들어 이 책을 보게 되었습니다.

시계열이라는 용어로 사용하는 데이터를 다루는 방법에 대해서 이 책에서 설명하고 있습니다. 날씨, 주식시장, 독감예측 등과 같은 좀 다를 것 같은 데이터 특성을 가진 것에 대해서 데이터를 분석하고, 처리하고, 저장하고, 모델링하여 머신러닝이나 딥러닝 등에 이용하는 부분에 대해서 다룹니다.

책은 시계열의 역사에 대해서 짧게 언급하고 데이터를 다루는 방법을 본격적으로 설명해서 머신 러닝과 딥러닝의 내용까지 설명하고, 실제로 시계열 데이터를 사용하는 애플리케이션들을 예로 들고, 마지막으로 미래 전망까지 다루고 있습니다.

솔직히 이 책은 데이터 공학을 본격적으로 공부하지 않은 사람에게는 어려운 책이라고 생각합니다. 첫 장의 역사 부분은 그럭저럭 가볍게 읽고 넘어갈 수 있었지만, 그 이후에는 어려운 용어와 경험해보지 못하거나 예측해보기 어려운 분야에 대한 설명들이 많아서 대체로 스킵하면서 읽어야 하는 부분이 많았습니다. 하지만, 시계열 데이터를 어떤 과정으로 다루는지에 대해서는 개략적으로 훑어보기에는 좋은 책이었습니다. 시계열 데이터를 대체로 이렇게 다루고 있고, 샘플링, 평활화, 사전 관찰 등과 같은 좀 익숙치 않은 용어들에 대해서도 인식하게 되었다는 점에서 의미를 두고 싶습니다.

이 책을 잘 활용하기 위해서는 우선 데이터 공학에 대한 기본적인 소양을 갖추고 있는 것이 좋을 것 같습니다. 그리고 파이썬과 R 언어는 익숙한 상태에서 이 책을 접근하는 것이 약간의 좌절감을 느낄 수 있는 상황을 피할 수 있지 않을까 합니다. 파이썬 언어에 익숙한 것뿐만 아니라 관련해서 사용하는 판다스나 sklearn 등의 패키지에도 익숙해야 소개하는 예제를 따라갈 수 있을 것 같습니다.

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

 
취소

댓글쓰기

저장
덧글 작성
0/1,000

댓글 수 0

댓글쓰기
첫 댓글을 작성해주세요.

PRIDE2