콘텐츠 바로가기
본문 바로가기


블로그 전체검색
실전 시계열 분석

[도서] 실전 시계열 분석

에일린 닐슨 저/박찬성 역

내용 평점 5점

구성 평점 5점

[나의 한줄 추천사]

시계열 데이터 다루는 방법을 A-Z 까지 알고 싶을때 보라

[책 추천 이유]

주식 데이터를 다룰때 시계열 데이터를 다루는 방법을 단편적으로 리서칭 했었는데, 해당 책을 통해서 기본적인 시계열 데이터의 특징부터 실시간 시계열 데이터 저장하는 방법, 데이터 분석 하는 방법까지 전부 알아 볼 수 있는 기회가 된다.

[내가 찾고자 했던 질문들]

1.시계열 데이터의 일반적인 문제들은?

- 누락된 데이터 (결측 데이터)

- 시계열의 빈도 변경(업샘플링, 다운샘플링)

- 데이터 평활

- 데이터의 계절적 변동 문제 해결

- 의도치 않은 사전관찰의 방지

2.시계열 데이터의 특성은?

- 읽기 작업보다는 쓰기 작업이 지배적으로 많이 발생함

- 데이터 쓰기, 읽기, 업데이트 작업은 임의의 순서가 아닌 일련의 사건이 일어나는 사건 순으로 이뤄짐

- 트랜잭션 데이터보다 훨씬 더 동시성 읽기가 수행될 가능성이 높음

- 타임스탬프을 기본키로 둘 경우가 많음

- 개별 삭제보다는 데이터 뭉치 형태로 삭제하는 것이 훨씬 일반적임

3.시계열 데이터 NoSQL 저장시 장점은?

- NoSQL 쓰기 속도가 빠르다.

- NoSQL은 미래 데이터를 아직 충분히 알지 못해서 스키마 정의가 어려울때 유리함

- NoSQL은 비전문가도 즉시 사용가능

4.시계열 데이터 통계 / 머신러닝 / 딥러닝 접근법은?

- 통계 : 자기회귀 모델, 이동평균 모델, 자기회귀누적이동평균 모델, 벡터자기회귀

- 머신러닝 : 결정트리 기법(분류), 클러스터링

- 딥라닝 : RNN(LSTM)

5.시계열 데이터 활용한 서비스들은?

- 헬스케어(독감 예측, 혈당치 예측), 금융 (주식 예측), 기상 (기상 예측), 정부 (전기사용량 예측)

6.좀더 알고 싶다면?

https://github.com/deep-diver/practical-time-series-analysis-korean

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


https://github.com/deep-diver/practical-time-series-analysis-korean
 
취소

댓글쓰기

저장
덧글 작성
0/1,000

댓글 수 0

댓글쓰기
첫 댓글을 작성해주세요.

PRIDE2