시계열(17)
-
다변량 선형 확률과정(VAR/Granger Causality/Cointegration)
다변량 선형 확률과정(VAR/Granger Causality/Cointegration) : 다변량 선형 확률과정을 공부하고자 함. : 해당 모델들은 결국 AR 모형을 번갈아 사용, X인자 추가, 적분을 활용한 내용들로 구성 됨. 1) 벡터자기회귀 모형(VAR) - 정상성 데이터 입력(차분 필요) 2) 그래인저 인과관계(Granger Causality) - 정상성 데이터 입력(차분 필요) 3) 공적분(Cointegration) - 비정상성 데이터 입력 : 다변량 선형 확률과정 복습을 위해 주식 데이터를 활용하기로 함 1. 벡터자기회귀 모형(VAR) : 종속 변수와 독립 변수는 상호 영향을 받는 존재. : 두 변수들 중 어떤 변수가 종속변수로 적합한지에 대한 문제를 해결하기 위해 VAR을 활용. import..
2021.01.07 -
시계열 데이터 분석 싸이클
시계열 데이터 분석 싸이클(Time Series Analysis Cycle) : 지금까지 공부해온 선형확률과정의 분석 싸이클을 다시 살펴보고자 함 1. 비정상 과정에서 정상 과정 추출 : 결정론적 추세나 확률적 추세가 있는지 확인 결정론적 추세는 회귀분석, 다항식 등으로 모형화 후 이를 분리 확률적 추세인 경우, 즉 ARIMA 모형인 경우에는 ADF(Augmented Dickey Fuller) 검정을 사용하여 적분차수(Order of Integration)을 알아내서 차분 2. 정규성 확인 : 정규성 검정을 통해 자료의 분포가 정규 분포인지 확인 일반 선형 확률 과정인 경우에는 전체 시계열이 가우시안 백색 잡음의 선형 조합으로 이루어지기 때문에 시계열 자체도 가우시안 정규 분포 ARIMA 모형 등의 일반..
2021.01.04 -
시계열 알고리즘_ARIMA/SARIMA
Time Series Analysis Method : 적분 선형확률과정 중 ARIMA, SARIMA 알고리즘을 살펴보기로 함 1. ARIMA(Auto-Regressive Integrated Moving Average) : ARIMA(p,d,q)란 1이상의 차분이 적용된 ΔdYt=(1−L)dYt가 알고리즘의 차수(p and q)가 유한한AR(p)와 MA(q)의 선형조합 비정상성인 시계열 데이터 Yt를 차분한 결과로 만들어진 ΔYt=Yt−Yt−1=(1−L)Yt가 정상성인 데이터이고 ARMA 모형을 따르면 원래의 Yt를 ARIMA 모형이라고 함 d≥1:* Yt는 비정상성 시계열 데이터(단위근을 갖음) d번 차분한 후 시계열 ΔdYt가 정상성인 데이터이고 ARMA(p,q) 모형을 따른다면 적분차수(Order o..
2020.12.21 -
시계열 알고리즘_AR/MA/ARMA
Time Series Analysis Method : 시계열 데이터 분석 방법 중 가장 기초적인 단순 선형 확률과정 알고리즘을 살펴봄 1. MA(Moving Average) : MA(q) 알고리즘 차수(q)가 유한한 가우시안 백색잡음과정의 선형조합 : Exponential Smoothing 내 Moving Average Smoothing은 과거의 Trend-Cycle을 추정하기 위함이고, MA는 미래 값을 예측하기 위함 : 움직임 특성 Stationarity Condition of MA(1): |𝜃1||𝜃2|𝜃1+𝜃2>−1θ1+θ2>−1, 𝜃1−𝜃2MA모형을 사용하면 차수가 ∞로 감 𝜙1=0: 𝑌𝑡Yt는 백색잡음 𝜙1𝜙1>0: 시차가 증가하면서 자기상관계수는 지수적으로 감소 𝜙1=1: 𝑌𝑡Yt는 비정상성..
2020.12.18 -
시계열 데이터 전처리3
종속변수의 정상성 이해하기 : 시계열 데이터 전처리의 마지막으로 종속변수의 정상성을 살펴봄 1. 정상성 : 시간이 흐름에 따라 "통계적 특성(Stastistical Properties)"이 변하지 않음을 정상이이 있다라고 표현 : "통계적 특성(Stastistical Properties)"이란 모멘텀이라 해서 수학적으로 n차 미분했을 때 통계적 특징(평균, 분산, 공분산 등) 2. 약정상 : 일반적인 정상성을 의미함 : 비 수학적 이해 𝑋𝑖1Xi1, 𝑋𝑖2Xi2, 𝑋𝑖3Xi3, ... have the same distribution. (𝑋𝑖1,𝑋𝑖3)(Xi1,Xi3), (𝑋𝑖5,𝑋𝑖7)(Xi5,Xi7), (𝑋𝑖9,𝑋𝑖11)(Xi9,Xi11), ... have the same joint distributi..
2020.12.16 -
시계열 데이터 전처리2
시계열 데이터 전처리시 유의사항 : 시계열 데이터 분석에 앞서 데이터를 정제할 때 숙지해야 하는 점을 정리하고자 함 1. 시간영역(해상도) 선택 : 시계열이 분석효과에 도움이 될 시간영역(해상도)을 분석가의 경험과 지식을 기반으로 선택해야 함 : 일반적으로 예측 정확성이 높은 시간영역을 선택하거나 예측 결과를 다시 학습으로 사용하여 연속적으로 사용함 : 연간 단위 비즈니스 목표 예측을 예시로 월별 또는 분기별 데이터를 사용하면 연간 데이터보다 나은 예측이 가능할 것 월/분기별 예측치를 연간으로 환산시 오류가 늘어날 것 같지만 실제로븐 반대의 경우가 많음 너무 세분화된 시간영역을 사용할 시 오류가 증가될 수 있음 2. 높은 정확도 or 높은 에러 : 시계열 데이터/분석은 높은 정확도를 낳거나 높은 에러를 ..
2020.12.15