하루 회고
패스트캠퍼스 데이터 사이언스 스쿨 (DAY 20)
수학 기초
1. 벡터
- 함수 기초
- 함수 심화(시그모이드, 다변수 벡터함수 등)
2. 행렬
- 단위행렬
- 전치행렬
- 행렬의 성질
- 역행렬, 고유값, 고유벡터
데이터 전처리
1. Scaler
- MinMaxScaler
- StandardScaler
- RobustScaler
- 와인 데이터를 활용한 스케일링 및 이진 분류 실습
모델 평가
1. 이진 분류 모델의 평가
- Accuracy
- Precision
- Recall
- Fall-Out
2. ROC / AUC
개인 작업
- 공공 데이터 처리하다말고 본격적인 팀 EDA 프로젝트 돌입 전 전처리 연습 및 주제 선정을 위해 잠시 다른 데이터 만져보는 중. 이것도 재밌는 결과가 나오면 올려봐야겠다.
- 시간대별 지하철역별 이용량으로 해당 역의 주변지역을 클러스터링 할 수 있지 않을까... 하는 러프한 아이디어에서 출발.
- 한 역당 그래프가 여러 개 그려지는 희한한 현상이 발생하였는데, 알고보니 에러가 아니고 내가 환승역을 처리하지 않아서였다. 예를 들어 합정역이라면 2호선 합정역과 6호선 합정역이 따로 처리되어 있는데 단순히 "합정역"으로 그래프를 그리면 2호선 하나, 6호선 하나 해서 두 개의 그래프가 나와버린 것. 당연한 건데 간과해버렸다.
- 간만에 만나는 1종 오류 / 2종 오류. 왠지 반갑다.
'Today I Learned' 카테고리의 다른 글
20210324_TIL (0) | 2021.03.25 |
---|---|
20210323_TIL (0) | 2021.03.24 |
20210321_TIL (0) | 2021.03.22 |
20210319_TIL (0) | 2021.03.20 |
20210318_TIL (0) | 2021.03.19 |