timeseries(10)
-
다변량 선형 확률과정(VAR/Granger Causality/Cointegration)
다변량 선형 확률과정(VAR/Granger Causality/Cointegration) : 다변량 선형 확률과정을 공부하고자 함. : 해당 모델들은 결국 AR 모형을 번갈아 사용, X인자 추가, 적분을 활용한 내용들로 구성 됨. 1) 벡터자기회귀 모형(VAR) - 정상성 데이터 입력(차분 필요) 2) 그래인저 인과관계(Granger Causality) - 정상성 데이터 입력(차분 필요) 3) 공적분(Cointegration) - 비정상성 데이터 입력 : 다변량 선형 확률과정 복습을 위해 주식 데이터를 활용하기로 함 1. 벡터자기회귀 모형(VAR) : 종속 변수와 독립 변수는 상호 영향을 받는 존재. : 두 변수들 중 어떤 변수가 종속변수로 적합한지에 대한 문제를 해결하기 위해 VAR을 활용. import..
2021.01.07 -
시계열 데이터 분석 싸이클
시계열 데이터 분석 싸이클(Time Series Analysis Cycle) : 지금까지 공부해온 선형확률과정의 분석 싸이클을 다시 살펴보고자 함 1. 비정상 과정에서 정상 과정 추출 : 결정론적 추세나 확률적 추세가 있는지 확인 결정론적 추세는 회귀분석, 다항식 등으로 모형화 후 이를 분리 확률적 추세인 경우, 즉 ARIMA 모형인 경우에는 ADF(Augmented Dickey Fuller) 검정을 사용하여 적분차수(Order of Integration)을 알아내서 차분 2. 정규성 확인 : 정규성 검정을 통해 자료의 분포가 정규 분포인지 확인 일반 선형 확률 과정인 경우에는 전체 시계열이 가우시안 백색 잡음의 선형 조합으로 이루어지기 때문에 시계열 자체도 가우시안 정규 분포 ARIMA 모형 등의 일반..
2021.01.04 -
시계열 알고리즘_ARIMA/SARIMA
Time Series Analysis Method : 적분 선형확률과정 중 ARIMA, SARIMA 알고리즘을 살펴보기로 함 1. ARIMA(Auto-Regressive Integrated Moving Average) : ARIMA(p,d,q)란 1이상의 차분이 적용된 ΔdYt=(1−L)dYt가 알고리즘의 차수(p and q)가 유한한AR(p)와 MA(q)의 선형조합 비정상성인 시계열 데이터 Yt를 차분한 결과로 만들어진 ΔYt=Yt−Yt−1=(1−L)Yt가 정상성인 데이터이고 ARMA 모형을 따르면 원래의 Yt를 ARIMA 모형이라고 함 d≥1:* Yt는 비정상성 시계열 데이터(단위근을 갖음) d번 차분한 후 시계열 ΔdYt가 정상성인 데이터이고 ARMA(p,q) 모형을 따른다면 적분차수(Order o..
2020.12.21 -
시계열 데이터 전처리1
시계열 데이터패턴 : 시계열 데이터 분석에 있어 파생변수를 만드는 것은 가장 중요하고 시간이 많이 걸리는 작업 : 변수 생성시 주의해야 할 2가지 미래의 실제 종속 변수 예측값이 어떤 독립/종속 변수의 FE에 의해 효과가 있을지 단정지을 수 없음 독립변수의 예측값을 FE를 통해 생성될 수 있지만 이는 종속변수 예측에 오류를 야기할 수 있음 1. 시계열 데이터패턴 추출 : 시계열 파생변수 종류 빈도(Frequncy) : 계절성 패턴(Seasonality)이 나타나기 전까지 사람이 정의 추세(Trend) : 시계열이 시간에 따라 증가, 감소 또는 일정 수준을 유지하는 경우 계절성(Seasonaliy) : 일정한 빈도로 주기적으로 반복되는 패턴 주기(Cycle) : 일정하지 않은 빈도로 발생하는 패턴 더미변수..
2020.12.10