콘텐츠 바로가기
본문 바로가기


블로그 전체검색
실전 시계열 분석

[도서] 실전 시계열 분석

에일린 닐슨 저/박찬성 역

내용 평점 5점

구성 평점 5점

 

 

지난 수년간, 수많은 데이터과학, ML/DL 분야의 도서들이 출간되어 왔지만, 유독 그 수가 매우 적은 카테고리가 있습니다. 바로 시계열 입니다. 데이터과학 개론서라던지, 통계학 교재에서 꼭 한 켠에 Time Series Analysis와 같은 이름으로 자리잡고 있긴 하지만, 메인으로 다루는 책은 거의 없었던 것이죠. 찾더라도 대부분, 대학교 내에서 출판하는 교과서 형태의 교재였습니다.

 

몇 년 전에 개인적으로 Facebook에서 나온 Prophet이라는 시계열 분석 라이브러리를 공부한 적이 있었습니다. 지금은 NeuralProphet이라는 이름으로, PyTorch를 기반으로 하여 신경망을 사용한 시계열 분석까지 가능한 새로운 버전이 출시되기도 했는데요. 과거에도 관련 자료가 국내에 거의 전무하여, 고생했던 기억이 있습니다. 시계열만을 본격적으로 다루는 책도 마땅치 않아, 통계학 책을 뒤적이던 기억도 납니다.

 

시계열은 이미 다양한 분야에서 사용되고 있습니다. 의료계부터 시작해서 최근에는 신생 헬스케어 기업들까지, ECG를 비롯한 여러 시계열 형태의 의료 데이터를 사용하여 다양한 가치를 창출해내는가 하면, 캐글과 데이콘 등의 각종 데이터 컴패티션에서 다루는 데이터도 상당수는 시계열 형태의 데이터입니다. 그렇기에, 이 책이 가지는 의미는 상당하다고 생각합니다.

 

책은 전반적으로 매우 꼼꼼하게, 시계열에 대해 다루고 있습니다. 그럼에도, 책의 매력적인 구성 덕분에 쭉 흥미를 가지고 읽을 수 있었습니다. 예컨대, 첫 파트는 시계열의 역사를 주제로 하여, 역사, 천문학, 금융 시장 등 다양한 분야에서 시계열이 사용되어온 사례를 보여주어, 채 몇 장이 되지 않는 분량으로도 간접적으로나마 시계열에 대해 흥미를 가지게 해주고 있습니다. 이어서 등장하는 데이터 취득 및 처리 부분에서는, 일종의 노하우와 같은 내용도 등장합니다. 개인적으로 타임스탬프에 관한 내용이 흥미로웠는데, 단순히 타임스탬프를 유용하게 가져다 쓰는 것이 아닌, 타임스탬프에 내재된 문제들을 제시하고 있습니다. 타임스탬프의 Log가 정말 실제 사건과 일치하지 않을 수 있다거나, 동시에 기록된 앱 사용자의 로그가 구체적으로 어떠한 것을 가르키고 있을지, 그 외의 데이터를 명료하게 이해할 수 있도록 하는 몇 가지 인사이트를 알려주는 부분입니다. 이어서 등장하는 결측치 처리 부분에서도 단순히 방법만을 전수하는 것이 아닌, 각기 다른 방법론에 대한 일종의 팁과 같은 정보를 전달하고 있습니다.

 

또, 모델 자체를 이해하고자 하는 사람들에게도 상당한 도움이 될 수 있도록, 수식을 풀어서 설명하고 있습니다. AR(Aturoregressive) 모델을 예로 들면, 단순히 해당 모델의 수식을 제시하고 끝내는 것이 아닌, 해당 수식이 어떠한 과정을 거쳐 작용하는지를 몇 장에 걸쳐서 설명합니다. MA, ARMA, ARIMA 모델 또한 마찬가지입니다. 이러한 고전적인 시계열 모델을 살펴본 후에는, 충분한 준비 단계를 거치며 머신러닝을 이용한 시계열 분석을 다루게 됩니다. 여기서는 랜덤 포레스트와 XGBoost를 이용하여 EEG, 뇌전도 데이터를 분류하는 모델을 만들어보는 실습을 진행하였는데요. 아무래도 ML 도서가 아니다보니 깊은 수준의 이해가 가능하도록 내용을 다루기보단 라이브러리를 사용한 실습 위주의 내용이 주를 이루고 있습니다. 이후 딥러닝을 이용한 방법 또한 다루고 있는데, 하이퍼파라미터를 조정하지 전까지, 딱 구현을 해보는 단계 까지만 진행을 하고 있습니다. 이 파트는 전체적으로, 추후 시계열 분석을 활용할 때에 많은 도움이 될 것 같다는 생각이 들었습니다. 

 

언제나 그렇듯, 오라일리의 도서답게, 교과서처럼 친절하게 상세히 시계열 분석에 대해 알려주고 있습니다. 이제, 시계열 분석을 좀 더 제대로 해보고자 하는 분들께, 표지만 봐도 숨이 턱턱 막히는 대학 교재스러운 시계열 분석 도서 대신 추천드릴만한 좋은 책이 나온 것 같습니다.

 

마치 '시계열 분석 교과서' 라는 제목을 붙여도 될 것만 같은 책입니다. 모쪼록, 시계열 분석에 관심이 있는 분들이라면, 꼭 해당 도서를 읽어보시길 강력 추천 드립니다.

 

 

 

본 리뷰는 한빛미디어의 도서 서평단 <나는 리뷰어다 2021> 프로그램의 일환으로, 무상으로 도서를 증정 받고 작성된 리뷰임을 고지합니다.

 
취소

댓글쓰기

저장
덧글 작성
0/1,000

댓글 수 0

댓글쓰기
첫 댓글을 작성해주세요.

PRIDE2