시계열 데이터 전처리3

2020. 12. 16. 10:35Data Science/02_Time Series Analysis

728x90

 

종속변수의 정상성 이해하기

 

: 시계열 데이터 전처리의 마지막으로 종속변수의 정상성을 살펴봄

 

 

1. 정상성

 

: 시간이 흐름에 따라 "통계적 특성(Stastistical Properties)"이 변하지 않음을 정상이이 있다라고 표현

: "통계적 특성(Stastistical Properties)"이란 모멘텀이라 해서 수학적으로 n차 미분했을 때 통계적 특징(평균, 분산, 공분산 등)

 


정상성


 

 

2. 약정상

 

: 일반적인 정상성을 의미함

: 비 수학적 이해

  • 𝑋𝑖1Xi1, 𝑋𝑖2Xi2, 𝑋𝑖3Xi3, ... have the same distribution.
  • (𝑋𝑖1,𝑋𝑖3)(Xi1,Xi3), (𝑋𝑖5,𝑋𝑖7)(Xi5,Xi7), (𝑋𝑖9,𝑋𝑖11)(Xi9,Xi11), ... have the same joint distribution. That's it.

 

: 수학적 이해

 

  • 𝐸(𝑋𝑖𝑡)=𝜇E(Xit)=μ, for all time 𝑡t (The first moment estimation)
  • 𝑉𝑎𝑟(𝑋𝑖𝑡)=𝐸(𝑋2𝑖𝑡)𝐸(𝑋𝑖𝑡)2<Var(Xit)=E(Xit2)−E(Xit)2<∞, for all time 𝑡t (The second moment estimation)
  • 𝐶𝑜𝑣(𝑋𝑖𝑠,𝑋𝑖𝑘)=𝐶𝑜𝑣(𝑋𝑖(𝑠+),𝑋𝑖(𝑘+))=𝑓()Cov(Xis,Xik)=Cov(Xi(s+h),Xi(k+h))=f(h), for all time 𝑠,𝑘,s,k,h (The cross moment estimation)

 

 

3. 강정상

 

: 확률과정의 모든 분포 모멘트(Moment)가 시간 차이에만 의존하는 것(절대시간 미의존)

: 비 수학적 이해

  • 𝑋𝑖1Xi1, 𝑋𝑖2Xi2, 𝑋𝑖3Xi3, ... have the same distribution.
  • (𝑋𝑖1,𝑋𝑖3)(Xi1,Xi3), (𝑋𝑖5,𝑋𝑖7)(Xi5,Xi7), (𝑋𝑖9,𝑋𝑖11)(Xi9,Xi11), ... have the same joint distribution.
  • (𝑋𝑖1,𝑋𝑖3,𝑋𝑖5)(Xi1,Xi3,Xi5), (𝑋𝑖7,𝑋𝑖9,𝑋𝑖11)(Xi7,Xi9,Xi11), (𝑋𝑖13,𝑋𝑖15,𝑋𝑖17)(Xi13,Xi15,Xi17), ... must have the same joint distribution.
  • (𝑋𝑖1,𝑋𝑖3,...,𝑋𝑖)(Xi1,Xi3,...,Xi∞) is invariant under all time translation.

 

: 백색잡음(White Noise, W N)는 강정상의 예시로 시계열분석 기본알고리즘 중 가장 중요함

: 잔차들은 1)정규분포이며, 2)평균과 일정한 분산을 가져야하고, 3)시간의 흐름에 따라 상관성이 없어야 함

 


백색 잡음(White Noise)


 

 

4. 랜덤 워크(Random Walk)

 

: 추세가 있어서 일차 모멘트가 0이 아니며 시간에 따라 변화함

: 비정상 데이터의 가장 기초적인 예시

: 𝑌𝑖𝑡=𝑌𝑖𝑡1+𝜖𝑡   =>  𝑌𝑖𝑡𝑌𝑖𝑡1=𝜖𝑡   =>   𝜖𝑡𝑊𝑁(0,𝜎2𝜖𝑡)

 


랜덤 워크


 

728x90