!! Steps to apply machine learing to real-world data
Step 1. Gather the Data - data leakage를 막아라! -> target value 만든 후 갱신되거나 생성된 variable은 배제 +) target leakage: 예측 시에 사용할 수 없는 data가 포함된 상태에서 예측을 할 때 발생 데이터를 이용할 수 있는 타이밍이나 정방향 순서대로(chronological order)의 관점에서 생각해봐야 함. +) On Kaggle, Go "Data" Category. Please read 'Data Description' carefully. then, Go "Notebooks" category, Click "New Notebook" Step 2. Prepare the Data - missing value를 컨트롤하기, categor..