시계열 6

시계열 통계모델 1 [이론] - Exponential Smoothing / Holt-Winter / AR / MA

해당 포스팅은 "실전 시계열 분석" 교재와 실습코드 / 고려대학교 DMQA 강의와 강의자료를 기반으로 작성되었습니다. https://www.youtube.com/watch?v=ma_L2YRWMHI&list=PLpIPLT0Pf7IqSuMx237SHRdLd5ZA4AQwd&index=9 1. 시계열 데이터와 선형 회귀 ? 시계열 데이터에는 통상적으로 회귀 모델을 사용하지 않는다. 그 이유는 선형 회귀 분석의 가정인 독립 항등분포 (Independently and Identically Distributed) 조건이 시계열 데이터에서는 성립하지 않는 경우가 대부분이기 때문이다. 시계열 데이터는 그 시간 step에 영향이 클수록 시간과 강한 상관관계를 가지고 있기에 위 가정이 성립되지 않아 선형 회귀를 쓰는 것이 ..

누락된 시계열 데이터

해당 포스팅은 "실전 시계열 분석" 교재와 실습코드를 기반으로 작성되었습니다. 시계열 데이터는 다른 데이터와 마찬가지로 누락된 값을 가질 수 있다. 오히려 비시계열 데이터와 다르게 같은 시간축의 시계열 데이터를 샘플링하는게 더 까다로울 수 있기에 누락된 값을 더 많이 가질 수 있다. 이런 누락된 데이터 문제를 해결하기 위해 쓰이는 일반적인 방법은 다음과 같다. 대치법 (Imputation) : 데이터셋 전체의 관측에 기반해 누락된 데이터를 채워넣는 방법 보간법 (Interpolation) : 대치법의 한 형태로 인접한 데이터를 사용하여 누락된 데이터를 추정하는 방법 누락된 데이터의 기간을 아예 사용하지 않는 방법 1. 데이터셋 기본 데이터는 1948년 미국 정부가 발표한 월간 실업 자료이고 실습을 위해 ..

시계열 모델링 - ARIMA

"금융 파이썬 쿡북 Ch3. 시계열 모델링 "의 내용을 기반으로 작성하였습니다. (실습 깃헙) 1. ARIMA 상세 ARIMA 모델의 내용은 본 책과 고려대 김성범 교수님의 유튜브 강의를 참고하였다. (좋은 내용 공유 감사드립니다.) https://www.youtube.com/watch?v=ma_L2YRWMHI ARIMA는 데이터의 자기 상관을 설명하는 방법을 사용한다. 이는 ARMA(Autoregressive Moving Average) 모델을 확장한 것이다. ARIMA의 구성요소에 대해 살펴보자. AR (Autoregressive) 모델 관측값과 지연값 사이의 관계를 사용 모멘텀과 평균 회귀 효과를 반영 I (Integration) 시계열의 차분을 의미, 이전 기간의 값을 현재 기간의 값에서 차감해 ..

시계열 모델링 - 지수 평활법

"금융 파이썬 쿡북 Ch3. 시계열 모델링 "의 내용을 기반으로 작성하였습니다. (실습 깃헙) 1. 지수 평활법 (Exponential Smoothing) 지수 평활법은 비정상 데이터(trend, seasonality를 띄는 데이터)에 사용하며 예측은 과거 관측값의 가중 평균을 사용한다는 점에서 지수 이동 평균과 유사하게 작동한다. 이 모델은 시간이 지나면서 가중치가 기하급수적으로 작아짐에 따라 최근 관측에 더 중점을 둔다. 이번 포스팅에서는 단순 지수 평활과 홀트 모델과 그 확장 모델에 대해 다뤄보겠다. 1-2. 단순 지수 평활 (SES, SImple Exponential Smoothing) 지수 평활의 가장 기본적인 모델이다. 이 모델은 고려 중인 시계열이 trend나 seasonality를 띄지 않..

시계열 정상성 검정 & 교정

"금융 파이썬 쿡북 Ch3. 시계열 모델링 "의 내용을 기반으로 작성하였습니다. (실습 깃헙) 1. 정상성 정상성(stationary) 시계열이란 평균, 분산, 공분산 등의 통계적 속성이 시간에 대해 일정한 시계열을 의미한다. 이런 정상성은 미래에 대한 모델링과 예측을 정확하게 해주므로 시계열에서의 바람직한 특성이다. 반대로 비정상성 데이터의 몇가지 단점은 다음과 같다. 모델의 분산이 잘못 지정될 수 있다. 모델의 적합화를 악화시킨다. 데이터의 시간 - 의존성이라는 귀중한 패턴을 활용할 수 없다. 2. 정상성 검정 정상성 검정을 위해서는 아래 세가지 방법을 활용 및 구현하였다. 데이터는 이전 '시계열 분해' 에서 사용한 데이터와 동일하다. https://needmorecaffeine.tistory.com..

시계열 분해

"금융 파이썬 쿡북 Ch3. 시계열 모델링 "의 내용을 기반으로 작성하였습니다. (실습 깃헙) 1. 시계열 분해 시계열 분해의 목표는 시계열을 여러 구성 요소로 나워 데이터에 대한 이해를 높이는 것이다. 이를 통해 모델링의 복잡성과 각 구성 요소를 정확하게 캡처하고 따랴아 하는 접근 방식에 대한 통찰력을 얻을 수 있다. 1-1. 시계열 구성 요소 이 때 언급되는 각 구성요소는 체계적과 비체계적인 두 가지 유형을 나눌 수 있다. 체계적 구성요소 Level : 계열의 평균값 Trend : 추세의 추정치, 즉 특정시점에서 연속 시점 사이의 값 변화. 시계열의 기울기와 연관됨. Seasonality : 단기 사이클로 반복되는 평균으로부터의 차이 비체계적 구성요소 Noise : 시계열 상의 랜덤 변화 1-2. 시..