snowwork

파이썬 머신러닝 판다스 데이터분석 [5] 본문

데이터 분석/퀀트

파이썬 머신러닝 판다스 데이터분석 [5]

denk 2021. 11. 3. 14:54

 

https://github.com/heradenk/python_pandas/tree/main/05_pandas_data_process

 

GitHub - heradenk/python_pandas

Contribute to heradenk/python_pandas development by creating an account on GitHub.

github.com

 

 

PART 5. 데이터 사전 처리
1. 누락 데이터 처리
2. 중복 데이터 처리
3. 데이터 표준화
3-1. 단위 환산
3-2. 자료형 변환
4. 범주형(카테고리) 데이터 처리
4-1. 구간 분할
4-2. 더미 변수
5. 정규화
6. 시계열 데이터
6-1. 다른 자료형을 시계열 객체로 변환
6-2. 시계열 데이터 만들기
6-3. 시계열 데이터 활용

 

 

데이터를 가공하는 도구들이 주요 내용이다.

누락이나 중복 데이터를 다루고 더미변수, 시계열 데이터까지.

데이터 집합을 조금 더 유용하게 만드는 역할을 하는 것 같다.

 

 

 

Comments