오리 공부로그

    EDA_제주지역 공간 데이터 분석

    0. 개요 연습용으로 Dacon에서 흥미로운 데이터를 하나 주워왔다. 2020년 5월~8월 동안 제주지역에서 발생한 결제금액 및 재난지원금 사용 금액에 관한 데이터다. 사람들은 과연 어느 업종에서 재난지원금을 많이 썼는지 알아보도록 하자. 공간정보 탐색적 데이터 분석 경진대회 출처 : DACON - Data Science Competition dacon.io 주요 column은 다음과 같다. FranClass : 규모(영세/중소/중소1/중소2/일반) Type : 업종명 TotalSpent : 총사용금액 DisSpent : 재난지원금 사용금액 NumOfSpent : 총 이용건수 NumOfDisSpent : 총 재난지원금 이용건수 1. 불러오기 일단 5월 데이터만 불러와보았다. info()를 이용해 대략적인..

    20210319_TIL

    하루 회고 패스트캠퍼스 데이터 사이언스 스쿨 (DAY 19) 데이터 시각화! 1. matplotlib - 기본적인 꺾은선 그래프 그리기 - 스타일 설정 - Bar chart / Pie chart / Histogram / Scatter plot 2. seaborn - seaborn.set() 을 이용해 그래프 스타일 적용 가능 - pairplot / lmplot / heatmap 3. folium - javascript에서 사용하는 지리정보 라이브러리를 python으로 변환 - 주별 미국 실업률 데이터로 지도 그리기 실습 - 서울시 공공자전거 대여정보 데이터로 지도 그리기 실습 개인 작업 - 제주도 공공데이터 전처리 중인데 산업 분류하는 것부터 생각보다 오래 걸리고 있다. 목표한 대로 주말 내에 완성할 수..

    20210318_TIL

    하루 회고 패스트캠퍼스 데이터 사이언스 스쿨 (DAY 18) 수학 기초 1. 다양한 타입의 함수 / 벡터 2. 함수 그리기 - matplotlib을 이용한 함수 표현 와인 데이터 실습 1. 와인 데이터(UCI machine learning database) 확인 및 전처리 - plotly를 이용한 데이터 탐색 - MinMaxScaler / StandardScaler 적용(의사결정나무에서는 의미를 가지지 않는 전처리지만, 학습을 위해 실습) - 전처리 시 주의사항 : 특징 데이터의 변형으로 만들어 낸 column을 라벨 데이터로 사용하지 말 것 UCI Machine Learning Repository: Wine Data Set Data Set Characteristics: Multivariate Numbe..