시계열 데이터 분석 싸이클
2021. 1. 4. 18:54ㆍData Science/02_Time Series Analysis
반응형
시계열 데이터 분석 싸이클(Time Series Analysis Cycle)
: 지금까지 공부해온 선형확률과정의 분석 싸이클을 다시 살펴보고자 함
1. 비정상 과정에서 정상 과정 추출
: 결정론적 추세나 확률적 추세가 있는지 확인
- 결정론적 추세는 회귀분석, 다항식 등으로 모형화 후 이를 분리
- 확률적 추세인 경우, 즉 ARIMA 모형인 경우에는 ADF(Augmented Dickey Fuller) 검정을 사용하여 적분차수(Order of Integration)을 알아내서 차분
2. 정규성 확인
: 정규성 검정을 통해 자료의 분포가 정규 분포인지 확인
- 일반 선형 확률 과정인 경우에는 전체 시계열이 가우시안 백색 잡음의 선형 조합으로 이루어지기 때문에 시계열 자체도 가우시안 정규 분포
- ARIMA 모형 등의 일반 선형 확률 과정으로 모형화하려면 우선 정규성 검정(Normality Test)을 사용하여 분포가 정규 분포인지 확인
: 로그, Box-Cox 변환을 사용하여 정규성이 개선된다면 변환 사용 가능
3. 정상 과정에 대한 ARMA 모형 차수 결정
: ACF/PACF 분석으로 AR(p) 모형 또는 MA(q) 모형 결정
- ACF가 특정 차수 이상에서 없어지는 경우(Cut-off)에는 MA 모형을 사용 가능
- PACF가 특정 차수 이상에서 없어지면 AR 모형을 사용 가능
- ACF와 PACF 모두 특정 차수 이상에서 없어지는 현상이 나타나지 않는다면 ARMA 모형을 사용
4. ARMA 모형의 모수 추정
: MM(Method of Modent)/LS(Least Square)/MLE(Maximum Likelihood Estimation) 등의 방법론
: ADF(Augmented Dickey Fuller) 검정을 사용하여 해당 수식에 대한 계수 즉 모수 값을 추정
: 부트스트래핑을 사용하여 모수의 표준 오차 추정
5. 잔차 진단(모형 진단)
: 모형이 추정된 후 잔차 검정을 통해 과정이 올바르게 진행됐는지 검증하는 과정
: 잔차가 백색 잡음이 될때까지 계속 모형을 수정해가면 이를 반복
- 잔차의 정상성 - > 잔차는 정상성이어야 함
- 잔차의 정규성 - > 잔차는 정규분포를 띄고 있어야 함
- 잔차의 등분산성 -> 잔차는 등분산성이어야 함
- 잔차의 자기상관성 - > 잔차는 자기상관성이 없어야 함
반응형
'Data Science > 02_Time Series Analysis' 카테고리의 다른 글
시계열 데이터 전처리(Encoding Time Step Features) (2) | 2022.01.31 |
---|---|
다변량 선형 확률과정(VAR/Granger Causality/Cointegration) (1) | 2021.01.07 |
시계열 알고리즘_ARIMA/SARIMA (0) | 2020.12.21 |
시계열 알고리즘_AR/MA/ARMA (0) | 2020.12.18 |
정규화(Regularization)/배깅(Bagging)/부스팅(Boosting) (0) | 2020.12.17 |