본문 바로가기
Drawing (AI)/Time Series

실전 시계열 분석 - Intro

by 생각하는 이상훈 2023. 3. 5.
728x90

시계열의 개요와 역사

시계열 분석(Time Series Analysis)은 시간 순서대로 정렬된 데이터에서 의미 있는 요약과 통계 정보를 추출하기 위한 것으로 과거 행동을 진단할 뿐만 아니라 미래행동을 예측하기 위해 이용된다.

과거부터 의학, 기상학, 경제학, 천문학등 다양한 학문에서 이용되어왔고 최근들어 기술의 발전으로 더욱 의미 있는 높은 수준의 결과를 만들어내고 있다.


머신러닝에서 시계열 분석

기계 학습은 시계열 데이터를 분석하는 데 점점 더 인기 있는 도구가 되었다. 

시계열 분석에 적합한 머신러닝 알고리즘 예시들은 다음과 같다.


자기 회귀 통합 이동 평균(ARIMA): ARIMA는 관측치와 과거 관측치의 선형 조합 사이의 의존성을 모델링하는 시계열 예측 알고리즘이다.
지수 평활(ETS): ETS는 관측치와 과거 관측치의 가중 조합 간의 의존성을 모델링하는 시계열 예측 알고리즘으로, 관측치가 오래될수록 가중치가 기하급수적으로 감소한다.
LSTM(Long Short-Term Memory): LSTM은 순환 신경망(RNN)의 한 유형으로 시계열 데이터와 같은 장기 종속성이 있는 시퀀스를 모델링하는 데 적합하다.
CNN(Convolutional Neural Networks): CNN은 이미지 분석에 일반적으로 사용되는 신경망의 일종이지만, 시간 차원을 공간 차원으로 처리하여 시계열 데이터에도 적용할 수 있다.

 

 

아래 논문은 Kenneth F. Wallis, "Revisiting Francis Galton's Forecasting Competition"으로 마을 장날에 산채로 도살된 소의 무게를 예측하는 매우 초기의 논문으로 역사적 가치가 있는 통계학 관련 논의가 담겨있다. 이는 추후에 논문 읽기를 진행할때 상세히 다뤄보려한다.

https://projecteuclid.org/journals/statistical-science/volume-29/issue-3/Revisiting-Francis-Galtons-Forecasting-Competition/10.1214/14-STS468.full?tab=ArticleLinkReference


728x90