시계열 데이터 분석 싸이클

2021. 1. 4. 18:54Data Science/02_Time Series Analysis

반응형

 

시계열 데이터 분석 싸이클(Time Series Analysis Cycle)

 

: 지금까지 공부해온 선형확률과정의 분석 싸이클을 다시 살펴보고자 함

 


시계열 데이터 분석 싸이클


 

 

1. 비정상 과정에서 정상 과정 추출

 

: 결정론적 추세나 확률적 추세가 있는지 확인

 

  • 결정론적 추세는 회귀분석, 다항식 등으로 모형화 후 이를 분리
  • 확률적 추세인 경우, 즉 ARIMA 모형인 경우에는 ADF(Augmented Dickey Fuller) 검정을 사용하여 적분차수(Order of Integration)을 알아내서 차분

 

 

 

 

 

2. 정규성 확인

 

: 정규성 검정을 통해 자료의 분포가 정규 분포인지 확인

 

  • 일반 선형 확률 과정인 경우에는 전체 시계열이 가우시안 백색 잡음의 선형 조합으로 이루어지기 때문에 시계열 자체도 가우시안 정규 분포
  • ARIMA 모형 등의 일반 선형 확률 과정으로 모형화하려면 우선 정규성 검정(Normality Test)을 사용하여 분포가 정규 분포인지 확인

: 로그, Box-Cox 변환을 사용하여 정규성이 개선된다면 변환 사용 가능

 

 

 

 

3. 정상 과정에 대한 ARMA 모형 차수 결정

 

: ACF/PACF 분석으로 AR(p) 모형 또는 MA(q) 모형 결정

 

  • ACF가 특정 차수 이상에서 없어지는 경우(Cut-off)에는 MA 모형을 사용 가능
  • PACF가 특정 차수 이상에서 없어지면 AR 모형을 사용 가능
  • ACF와 PACF 모두 특정 차수 이상에서 없어지는 현상이 나타나지 않는다면 ARMA 모형을 사용

 

 

 

 

4. ARMA 모형의 모수 추정

 

: MM(Method of Modent)/LS(Least Square)/MLE(Maximum Likelihood Estimation) 등의 방법론

: ADF(Augmented Dickey Fuller) 검정을 사용하여 해당 수식에 대한 계수 즉 모수 값을 추정

: 부트스트래핑을 사용하여 모수의 표준 오차 추정

 

 

5. 잔차 진단(모형 진단)

 

: 모형이 추정된 후 잔차 검정을 통해 과정이 올바르게 진행됐는지 검증하는 과정

: 잔차가 백색 잡음이 될때까지 계속 모형을 수정해가면 이를 반복

  • 잔차의 정상성 - > 잔차는 정상성이어야 함
  • 잔차의 정규성 - > 잔차는 정규분포를 띄고 있어야 함
  • 잔차의 등분산성 -> 잔차는 등분산성이어야 함
  • 잔차의 자기상관성 - > 잔차는 자기상관성이 없어야 함

 

반응형