따릉이
[머신러닝] 모델 학습 데이터셋 다르게 적용해보기 본문
모델의 파라미터를 바꾸어 학습해본 결과, mae의 변화가 미세하여
모델의 학습 데이터셋을 아래의 4가지로 다르게 적용한 후 모델 학습을 진행해보았다.
1. 2019년 따릉이 대여량 데이터
2. 2020년 따릉이 대여량 데이터
3. 2020년 따릉이 대여량 데이터 + 일별 확진자 발생 수 (자치구)
4. 2020년 따릉이 대여량 데이터 + 일별 확진자 발생 수 (서울시 전체)
<종로구>
1. 2019년 따릉이 대여량 데이터 - mae : 1.1194824219238666
2. 2020년 따릉이 대여량 데이터 - mae : 0.9144775435765843
3. 2020년 따릉이 대여량 데이터 + 일별 확진자 발생 수 (자치구) - mae : 0.9476497684282542
4. 2020년 따릉이 대여량 데이터 + 일별 확진자 발생 수 (서울시 전체) - mae : 0.9422609639860312
<광진구>
1. 2019년 따릉이 대여량 데이터 - mae : 1.4554207920315467
2. 2020년 따릉이 대여량 데이터 - mae : 1.1932344704548266
3. 2020년 따릉이 대여량 데이터 + 일별 확진자 발생 수 (자치구) - mae : 1.2422914092347574
4. 2020년 따릉이 대여량 데이터 + 일별 확진자 발생 수 (서울시 전체) - mae : 1.2227851540778518
데이터셋 | 종로구 | 광진구 |
2018년 - 2020년 (기존) | 0.953 | 1.307 |
2019년 | 1.1194824219238666 | 1.4554207920315467 |
2020년 | 0.9144775435765843 | 1.1932344704548266 |
2020년 + 자치구별 확진자 수 | 0.9476497684282542 | 1.2422914092347574 |
2020년 + 서울시 총 확진자 수 | 0.9422609639860312 | 1.2227851540778518 |
'머신러닝' 카테고리의 다른 글
[머신러닝] 대여량값 이상치 제거 및 결과 (0) | 2021.08.24 |
---|---|
[머신러닝] 자치구별 모델 (피쳐중요도/MAE/Parameter) (0) | 2021.07.12 |
[머신러닝] 결정트리 모델 실습 (0) | 2021.07.05 |
[머신러닝] 랜덤포레스트 모델 실습 (0) | 2021.07.03 |
[머신러닝] xgboost 모델 실습 (0) | 2021.07.03 |
Comments