BOARD

NOTICE

HOME > Board > Notice
[Code자료] 시계열 데이터 분석 입문(time series kaggle dataset-sklearn, electricity demand)
  • 관리자
  • |
  • 430
  • |
  • 2022-10-21

3-4학년 논문조 및 학부생들이 처음 환경 시계열 데이타 분석을 다룰떄 유용한 샘플 코드 공유

 

https://colab.research.google.com/drive/1kQ68rS3RuWTG3_7AlyWK_TiZ-twQzF8B#scrollTo=HaIoMkJjQMWm

1. Data

1.1. Data 불러오기 

 

2. Time Series data analysis

 

2.1. Visualization

2.2. Noise reduction : Resampling

2.3. Trend Searching

2.4. "stationary"

 2.5. "seasonality"

 * Fourier Transformation

* Autocorrelation

 2.6. Feature Extraction

 * 요일, 연중 날짜

* -1~-6일까지 demand shift

3. Machine Learning

3.3. X, y 분할
3.4. Pipeline 구축
3.5. 모델 교체 : Random Forest
3.6. hyperparameter tuning

*Grid Search

*Data Split for Cross Validation, for Time Series

*Random Search

*Bayesian Search

4. 
--------------------------------------
시계열 데이터 입문 강의용 코드
- 캐글 데이터셋을 사용해 시계열 예보 입문 강의를 했습니다.
- 사이킷런 공식 홈페이지를 비롯해 여러 레퍼런스를 재구성했습니다.
- 시계열을 시작하시는 분께 도움이 되고자 실습코드를 공유드립니다.

 

https://www.facebook.com/groups/KaggleKoreaOpenGroup/permalink/1226684588063638/?sfnsn=mo&ref=share  

이전글 [추계 화공학회 발표]허성구(Data-Centric 증류탑 AI softsensor) & 우태용(Membrane remaining useful lifetime 예지정비 모델)
다음글 [Shahzeb통합, Tunnelling~, JCR10%] Deep-AI soft sensor at sensor devoid space (Deep-AI 소프트센서-A zero-shot transfer learning)