snowwork
파이썬 머신러닝 판다스 데이터분석 [5] 본문

https://github.com/heradenk/python_pandas/tree/main/05_pandas_data_process
GitHub - heradenk/python_pandas
Contribute to heradenk/python_pandas development by creating an account on GitHub.
github.com
PART 5. 데이터 사전 처리
1. 누락 데이터 처리
2. 중복 데이터 처리
3. 데이터 표준화
3-1. 단위 환산
3-2. 자료형 변환
4. 범주형(카테고리) 데이터 처리
4-1. 구간 분할
4-2. 더미 변수
5. 정규화
6. 시계열 데이터
6-1. 다른 자료형을 시계열 객체로 변환
6-2. 시계열 데이터 만들기
6-3. 시계열 데이터 활용
데이터를 가공하는 도구들이 주요 내용이다.
누락이나 중복 데이터를 다루고 더미변수, 시계열 데이터까지.
데이터 집합을 조금 더 유용하게 만드는 역할을 하는 것 같다.
'데이터 분석 > 퀀트' 카테고리의 다른 글
| 파이썬 머신러닝 판다스 데이터분석 [7] (1) | 2021.11.05 |
|---|---|
| 파이썬 머신러닝 판다스 데이터분석 [6] (1) | 2021.11.04 |
| 파이썬 머신러닝 판다스 데이터분석 [4] (1) | 2021.11.02 |
| 파이썬 머신러닝 판다스 데이터분석 [3] (1) | 2021.10.29 |
| 파이썬 머신러닝 판다스 데이터분석 [2] (0) | 2021.10.29 |
Comments