목록데이터 분석 (15)
snowwork

https://github.com/heradenk/python-ML GitHub - heradenk/python-ML Contribute to heradenk/python-ML development by creating an account on GitHub. github.com 3~4개월 거쳐 1회독을 끝냈다. 본격적으로 머신러닝 입문부터 응용까지 한 흐름으로 배울 수 있는 책인 것 같다. 내용은 머신러닝 개념, 넘파이-판다스-사이킷런 등의 라이브러리, 데이터 가공, 분류, 처리, 평가 등, 캐글 예제, 여러가지 툴, 추천시스템으로 정리해볼 수 있을 것 같다. 생각보다 머신러닝에는 체계화된 다양한 과정이 있고 이들에 쓰이는 툴 또한 다양하다. 목적과 스타일에 따라 다르게 조합해볼 수 있는 것 같고 예전보..

페어트레이딩이란, 상관관계가 있는 주식끼리 상대적으로 가격등락을 비교해 그 조정 사이에 초과수익을 얻는 방식이라고 정리할 수 있을 것 같다. 흔히 섹터를 주도하는 주식이 먼저 오르고 나중에 동종산업이 오르는 식의 원리인데, 이를 수학적으로 분석해보는 것이 취지이다. https://blog.naver.com/chunjein/100149458425 1. 머리말페어트레이딩 (Pairs Trading) - 기초(1) 머리말 주식 시장에는 주가의 흐름이 유사한 종목이 많이 있다....blog.naver.com 우연히 12년도부터 가이드를 작성해온 블로그를 발견해 이를 기반으로 실습을 해봤다. 본문에선 합병되기도 전인 기아 자동차와 현대자동차를 예로 들었는데, 나는 메타로 사명을 바꾼 페이스북과 스냅을 비교군으로 ..

https://github.com/heradenk/python_pandas/tree/main/07_pandas_machine_learning GitHub - heradenk/python_pandas Contribute to heradenk/python_pandas development by creating an account on GitHub. github.com PART 7. 머신러닝 데이터 분석 1. 머신러닝 개요 1-1. 머신러닝이란? 1-2. 지도 학습 vs 비지도 학습 1-3. 머신러닝 프로세스 2. 회귀분석 2-1. 단순회귀분석 2-2. 다항회귀분석 2-3, 다중회귀분석 3. 분류 3-1. KNN 3-2. SVM 3-3. Decision Tree 4. 군집 4-1. k-Means 4-2. DB..

https://github.com/heradenk/python_pandas/tree/main/06_pandas_dataframe GitHub - heradenk/python_pandas Contribute to heradenk/python_pandas development by creating an account on GitHub. github.com PART 6. 데이터프레임의 다양한 응용 1. 함수 매핑 1-1. 개별 원소에 함수 매핑 1-2. 시리즈 객체에 함수 매핑 1-3. 데이터프레임 객체에 함수 매핑 2. 열 재구성 2-1. 열 순서 변경 2-2. 열 분리 3. 필터링 3-1. 불린 인덱싱 3-2. isin( ) 메소드 활용 4. 데이터프레임 합치기 4-1. 데이터프레임 연결 4-2. 데이터프..

https://github.com/heradenk/python_pandas/tree/main/05_pandas_data_process GitHub - heradenk/python_pandas Contribute to heradenk/python_pandas development by creating an account on GitHub. github.com PART 5. 데이터 사전 처리 1. 누락 데이터 처리 2. 중복 데이터 처리 3. 데이터 표준화 3-1. 단위 환산 3-2. 자료형 변환 4. 범주형(카테고리) 데이터 처리 4-1. 구간 분할 4-2. 더미 변수 5. 정규화 6. 시계열 데이터 6-1. 다른 자료형을 시계열 객체로 변환 6-2. 시계열 데이터 만들기 6-3. 시계열 데이터 활용 데이..

https://github.com/heradenk/python_pandas/tree/main/04_pandas_visualize GitHub - heradenk/python_pandas Contribute to heradenk/python_pandas development by creating an account on GitHub. github.com PART 4. 시각화 도구 1. Matplotlib - 기본 그래프 도구 1-1. 선 그래프 1-2. 면적 그래프 1-3. 막대 그래프 1-4. 히스토그램 1-5. 산점도 1-6. 파이 차트 1-7. 박스 플롯 2. Seaborn 라이브러리 - 고급 그래프 도구 3. Folium 라이브러리 - 지도 활용 인구이동 데이터 중 서울에서 다른 도시들로 나가는 인..