Day1 | Day2 | Day3 | |
---|---|---|---|
주제 | 최대수요전력 예측 | 스프링 내구력 테스트 통과/실패 예측 | 세탁 지수 예측 |
출제 영역 |
데이터 전처리 > Join, 표준화, 일자(date) 형식 처리, shifting 데이터 추출 > GroupBy, … 가설 검정 > Shapiro-Wilks, Bartlett, T, 일원산 분산분석, Mann-Whitney U Chi2 독립성 검정, 이원산 분산분석 지도학습 > 결정트리, GBDT, SVM 비지도학습 > PCA, DBSCAN 이상치 탐색 > Isolation Forest, Local Outlier Factor |
결측치 처리 > 반복적 결측치 처리 가설 검정 > 베르눌리 분포, 정규 분포 속성 선택 > 필터법, 전진선택법 가설 검정 > Jarque-bera, Bartlett, 일원산 분산분석 지도학습 > 로지스틱 회귀, 랜덤 포레스트, LDA 비지도학습 > PCA 하이퍼 파라미터 최적화 > 그리드 서치 |
데이터 전처리 > 치환, 문자열 결합, 표준화, 구간범주화, 가변수화 가설 검정 > Kolmogolov-Smironov, Bartlett, 일원산 분산분석 확률 통계 > 정규분포 지도학습 > Linear Regression, xgboost 비지도학습 > Agglomerative Clustering, PCA 하이퍼 파라미터 최적화 |
구분 | 강의 내용 | 시작 | 끝 |
---|---|---|---|
0 | 전처리 | 8시 30분 | 9시 30분 |
1 | 문제 1 | 9시 40분 | 10시 40분 |
2 | 문제 2 | 10시 50분 | 11시 50분 |
3-1 | 문제 3 | 12시 00분 | 12시 30분 |
3-2 | 문제 3 | 13시 30분 | 14시 10분 |
4 | 문제4 | 14시 20분 | 15시 20분 |
5 | 문제5 | 15시 30분 | 16시 30분 |
6 | 문제6 | 16시 40분 | 17시 30분 |
Day1
2-6: 검정통계량 -> pvalue, scipy.stats.mannwhitenyu -> scipy.stats.mannwhitneyu
※ 모든 실습 내용 들은 실습내용.zip에 정리 되었습니다.
실습파일.zip 처음 버젼에 누락된 파일이 있습니다. 다시 넣어 정리했습니다.
감사합니다