🏆 2022 UBION Project2
본 프로젝트는 잠재한계기업(2년 연속 이자보상배율 1미만)을 대상으로 (t+1)년에 한계기업이 될지, 아니면 회생기업이 될지를 분류 예측하고자 한다. 이를 위해 9개의 최적 피쳐를 선정하였고, 총 11가지의 분류, 딥러닝 알고리즘을 활용해 가장 뛰어난 성능을 보인 XGB Classifier를 최종 모델로 선정하였다. 최종모델을 통해 예측된 회생기업을 대상으로 3가지의 투자 비중과 5가지의 매매전략을 조합하여 총 15가지의 투자 전략을 검증하였다. 이를 통해 코로나로 인해 누증된 한계기업을 사전예측하여 기업대출 등에 활용할 수 있으며, 향후 다가올 경기회복세에 증가할 회생기업을 대상으로 위 투자 전략을 활용해 수익률을 창출이 가능하다.
- 출처 : KRX & TS200
- 수집기간 : 2011 ~ 2019(IFRS도입 이후 ~ 코로나 이전)
- 대상종목 : KOSPI & KOSDAQ 상장기업
- 제거 종목 : 금융 및 보험업, 스팩주, 상장폐지, 외국계기업
- 선정 피쳐 : 총 80개(재무재표데이터 + 파생변수 + 주가데이터)
- 거래소코드가 2개인 기업(26개) 중복 제거
- 회사명이 2개인 거래소코드 중복 확인
- 데이터가 하나 밖에 없는 기업 데이터 삭제
- 연결제무재표데이터 별도제무재표데이터로 대체
- 999999 (inf, -inf) 제거(이자보상배율 제외)
- 이자보상배율의 inf 값은 winsorizing 처리
- 양극단치 2.5%씩 winsorizing(Object 피쳐 제외)
- 파생변수(증가율) 이상치 처리
- 전년도, 올해 값이 존재할 경우 증가율 컬럼 생성
- 전년도(0) & 올해(0) : 증가율 =0
- 전년도(0) & 올해(0이상) : drop
- inf가 많이 생성되는 컬럼은 drop
- 잠재한계기업(2년 연속 이자보상배율이 1미만인 기업)으로 필터링
- 기업당 데이터는 1개(최초 잠재한계 데이터만 사용)
- Label1 : 한계기업((t+1)년도에 이자보상배율이 1미만인 기업.(3년 연속))
- Label0 : 회생기업((t+1)년도에 이자보상배율이 1이상인 기업. 즉 잠재한계기업 중 정상화된 기업)
- Train set : 2012 ~ 2016
- Test set : 2017, 2018
- Scaling : Train set, test set 각각 Standard scaling(Data Leakage 방지)
- Train set으로만 Feature Selection
- 검정
- 정규성검정(Shapiro, Anderson, KS test, Jarque_bera test, Normal test, Dist plot, qq plot)
- 독립성검정(Durbin-Watson)
- 등분산검정(Bartlett test)
- 아래 4개 모델 중 3개 이상 중복 피쳐를 최종 선택
- T-test(통계분석)
- Lasso(Wrapper Method)
- Stepwise(Embbeded Method)
- Kbest(Filter Method)
[단일분류]
- Logistic
- KNN
- Decision Tree
- Naive Bayes
- SVM
[Ensamble]
- Random Forest - XGB
- LGBM
- Voting
- Stacking
[Deeplearning]
- TabNet
-> 최종모델 : XGBClaasifier
- ACC : 0,73
- Precision : 0.73
- Recall : 0.97
- F1-score : 0.83
- AUC : 0.59
[Recall이 상대적으로 높은 성능을 보이는 모델]
- 이를 통해 한계기업으로 많이 예측하여 회생기업이라고 잘못 예측했을 때의 리스크를 줄임
- 회생기업(0)의 관점에서는 확실한 회생기업만 회생이라고 예측하기에 투자에 활용하기 좋은 모델
- 백테스팅 기간 : 2013.04~2019.12(회계년도기준 (t+1)년 4월부터 (t+2)년 3월까지)
- 투자유니버스 : 2012~2018 중 예상회생기업
- 벤치마크 : 투자유니버스의 전종목 동등비중/Buy&Hold 수익률
[백테스팅]
-
연도마다 총 15(3x5)가지의 투자
-
종목별 투자비중(3) : 동등비중 / 샤프지수 최대화 / 리스크 최소화
-
매매전략 : Buy&Hold / 추세추종1/ 추세추종2 / 추세추종3 / 역추세
-
평가
- 벤치마크와 CAGR/ Sharpe ratio로 비교평가(매년)
-> 동등비중 x 역추세 전략이 최적
(*아래 ppt예시)