분석(2)
-
태양광 발전량 예측 AI 경진대회_Dacon(1/3부)
태양광 발전량 예측 AI 경진대회_Dacon(1/3부) : 시계열 데이터 분석을 공부하면서 배운 내용을 실제로 활용해 보기 위해 해당 competition에 참가하게 됨 : 분석 주제는 지역의 기상 데이터와 과거 발전량 데이터를 활용하여, 시간대별 태양광 발전량을 예측(30분 단위) : 한 달이 넘는 기간동안 참가했으며 대회 종료까지 104회 제출하여 Public 1위, Private Top10 기록 : 해당 대회는 굉장히 큰 Shake Up이 발생해 최종적으로는 수상을 하지 못함 : 사실 local CV와 LB score가 굉장히 틀려 과적합을 의심했었지만 LB score의 미련을 버리지 못한 실수인지.... : 이번 대회에서는 모델링뿐만 아니라 FE(feature engineering)이 매우 중요했..
2021.02.24 -
잔차 진단
분석 종료를 위한 잔차 진단 : 잔차진단을 위한 통계적 방법을 공부해보자 1. 백색잡음(White Noise) : 백색잡음(Withe Noise)란 패턴이 남아있지 않고 무작위로 야기되는 잡음 : 백색잡음(White Noise)는 2가지 속성을 만족해야 하며 하나라도 만족하지 못하면 모델이 개선의 여지가 있음을 의미함 잔차들은 정규분포이며, 평균 0과 일정한 분산을 가져야 함 잔차들이 시간의 흐름에 따라 상관성이 없어야 함 : 시계열 예측 모델이 실제 현상의 트렌드와 주기를 잘 반영할수록 잔차의 변동이 작아지고 이를 바탕으로 모델 개선 여부를 파악 : 잔차 진단의 결과는 주로 시각화로 확인이 가능하며 추세 및 주기 중 어떤 것을 건드려야할지 의사결정이 됨 2. 진단 방법 1) 정상성 테스트 Augment..
2020.12.14