AI/Numpy & Pandas

Data preprocessing

Nolja놀자 2021. 1. 22. 11:05
반응형

 

 

 

 

1. 데이터 결측치 처리

2. 라벨링된 데이터 처리

3. 데이터의 scale의 차이가 매우 클 경우 

 

 

 

 

데이터 결측치 처리

1) 데이터가 없으면 sample을 드롭

2) 데이터가 없는 최소 개수를 정해서 sample을 드롭

3) 데이터가 거의 없는 feature는 feature

4) 최빈값, 평균값으로 비어있는 데이터를 채우기

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

반응형