잔차 진단

2020. 12. 14. 15:24Data Science/02_Time Series Analysis

반응형

 

분석 종료를 위한 잔차 진단

 

잔차진단을 위한 통계적 방법을 공부해보자

 

 

1. 백색잡음(White Noise)

 

: 백색잡음(Withe Noise)란 패턴이 남아있지 않고 무작위로 야기되는 잡음

: 백색잡음(White Noise)는 2가지 속성을 만족해야 하며 하나라도 만족하지 못하면 모델이 개선의 여지가 있음을 의미함

  • 잔차들은 정규분포이며, 평균 0과 일정한 분산을 가져야 함
  • 잔차들이 시간의 흐름에 따라 상관성이 없어야 함

: 시계열 예측 모델이 실제 현상의 트렌드와 주기를 잘 반영할수록 잔차의 변동이 작아지고 이를 바탕으로 모델 개선 여부를 파악

: 잔차 진단의 결과는 주로 시각화로 확인이 가능하며 추세 및 주기 중 어떤 것을 건드려야할지 의사결정이 됨

 


백색잡음(White Noise)


 

 

2. 진단 방법

 

1) 정상성 테스트 

  • Augmented Dickey-Fuller(ADF) Test 를 주로 사용함
  • 시간이 흘러도 일정한 상태를 유지함
  • 자기상관  + 등분산성을 아우름
  • 귀무가설 : 비정상 상태, 단위근이 존재, 시간 의존성
  • 대립가설 : 정상 상태, 단위근이 존재x, 시간 의존성x

 

2) 정규분포 테스트

  • Shapiro-Wilk test, Kolmogorov-Smirnov test 등을 사용
  • 귀무가설 : 정규분포 형태다.
  • 대립가설 : 정규분포가 아니다.

정규분포 비교


 

3) 자기상관 테스트 

  • Ljung-Box test, Durbin-Watson test 등을 사용
  • 귀무가설 : 시계열 데이터의 자기상관성이 0이다.
  • 대립가설 : 시계열 데이터의 자기상관성은 0이 아니다.

자기상관 그래프


 

4) 등분산성 테스트 

  • Goldfeld-Quandt test, Bartlett's test 등을 사용
  • 귀무가설 : 시계열 데이터는 등분산이다
  • 대립가설 : 시계열 데이터는 등분산이 아니다.(발산하는 분산이다.)

 

반응형

'Data Science > 02_Time Series Analysis' 카테고리의 다른 글

시계열 데이터 전처리3  (0) 2020.12.16
시계열 데이터 전처리2  (0) 2020.12.15
시계열 데이터 전처리1  (0) 2020.12.10
가설 검정  (0) 2020.12.02
시계열 및 통계 용어  (0) 2020.11.27