목록데이터분석 (11)
snowwork

https://github.com/heradenk/python-ML GitHub - heradenk/python-ML Contribute to heradenk/python-ML development by creating an account on GitHub. github.com 3~4개월 거쳐 1회독을 끝냈다. 본격적으로 머신러닝 입문부터 응용까지 한 흐름으로 배울 수 있는 책인 것 같다. 내용은 머신러닝 개념, 넘파이-판다스-사이킷런 등의 라이브러리, 데이터 가공, 분류, 처리, 평가 등, 캐글 예제, 여러가지 툴, 추천시스템으로 정리해볼 수 있을 것 같다. 생각보다 머신러닝에는 체계화된 다양한 과정이 있고 이들에 쓰이는 툴 또한 다양하다. 목적과 스타일에 따라 다르게 조합해볼 수 있는 것 같고 예전보..

https://github.com/heradenk/python_pandas/tree/main/07_pandas_machine_learning GitHub - heradenk/python_pandas Contribute to heradenk/python_pandas development by creating an account on GitHub. github.com PART 7. 머신러닝 데이터 분석 1. 머신러닝 개요 1-1. 머신러닝이란? 1-2. 지도 학습 vs 비지도 학습 1-3. 머신러닝 프로세스 2. 회귀분석 2-1. 단순회귀분석 2-2. 다항회귀분석 2-3, 다중회귀분석 3. 분류 3-1. KNN 3-2. SVM 3-3. Decision Tree 4. 군집 4-1. k-Means 4-2. DB..

https://github.com/heradenk/python_pandas/tree/main/06_pandas_dataframe GitHub - heradenk/python_pandas Contribute to heradenk/python_pandas development by creating an account on GitHub. github.com PART 6. 데이터프레임의 다양한 응용 1. 함수 매핑 1-1. 개별 원소에 함수 매핑 1-2. 시리즈 객체에 함수 매핑 1-3. 데이터프레임 객체에 함수 매핑 2. 열 재구성 2-1. 열 순서 변경 2-2. 열 분리 3. 필터링 3-1. 불린 인덱싱 3-2. isin( ) 메소드 활용 4. 데이터프레임 합치기 4-1. 데이터프레임 연결 4-2. 데이터프..

https://github.com/heradenk/python_pandas/tree/main/05_pandas_data_process GitHub - heradenk/python_pandas Contribute to heradenk/python_pandas development by creating an account on GitHub. github.com PART 5. 데이터 사전 처리 1. 누락 데이터 처리 2. 중복 데이터 처리 3. 데이터 표준화 3-1. 단위 환산 3-2. 자료형 변환 4. 범주형(카테고리) 데이터 처리 4-1. 구간 분할 4-2. 더미 변수 5. 정규화 6. 시계열 데이터 6-1. 다른 자료형을 시계열 객체로 변환 6-2. 시계열 데이터 만들기 6-3. 시계열 데이터 활용 데이..

https://github.com/heradenk/python_pandas/tree/main/04_pandas_visualize GitHub - heradenk/python_pandas Contribute to heradenk/python_pandas development by creating an account on GitHub. github.com PART 4. 시각화 도구 1. Matplotlib - 기본 그래프 도구 1-1. 선 그래프 1-2. 면적 그래프 1-3. 막대 그래프 1-4. 히스토그램 1-5. 산점도 1-6. 파이 차트 1-7. 박스 플롯 2. Seaborn 라이브러리 - 고급 그래프 도구 3. Folium 라이브러리 - 지도 활용 인구이동 데이터 중 서울에서 다른 도시들로 나가는 인..

https://github.com/heradenk/python_pandas/tree/main/03_pandas_data GitHub - heradenk/python_pandas Contribute to heradenk/python_pandas development by creating an account on GitHub. github.com PART 3. 데이터 살펴보기 1. 데이터프레임의 구조 1-1. 데이터 내용 미리보기 1-2. 데이터 요약 정보 확인하기 1-3. 데이터 개수 확인 2. 통계 함수 적용 2-1. 평균값 2-2. 중간값 2-3. 최대값 2-4. 최소값 2-5. 표준편차 2-6. 상관계수 3. 판다스 내장 그래프 도구 활용 기본적으로 사용되는 도구들을 소개하는 장.