Skip to content

Jyassmin/UBION-PROJECT2

Repository files navigation

Hits

RETURNUP "한계기업 예측 모형을 통한 회생기업 투자 전략 검증 및 수익률 비교"



🏆 2022 UBION Project2

DB공모전_returnup

슬라이드6

슬라이드18

슬라이드75


프로젝트 소개

본 프로젝트는 잠재한계기업(2년 연속 이자보상배율 1미만)을 대상으로 (t+1)년에 한계기업이 될지, 아니면 회생기업이 될지를 분류 예측하고자 한다. 이를 위해 9개의 최적 피쳐를 선정하였고, 총 11가지의 분류, 딥러닝 알고리즘을 활용해 가장 뛰어난 성능을 보인 XGB Classifier를 최종 모델로 선정하였다. 최종모델을 통해 예측된 회생기업을 대상으로 3가지의 투자 비중과 5가지의 매매전략을 조합하여 총 15가지의 투자 전략을 검증하였다. 이를 통해 코로나로 인해 누증된 한계기업을 사전예측하여 기업대출 등에 활용할 수 있으며, 향후 다가올 경기회복세에 증가할 회생기업을 대상으로 위 투자 전략을 활용해 수익률을 창출이 가능하다.


구조

0. 데이터 수집

  • 출처 : KRX & TS200
  • 수집기간 : 2011 ~ 2019(IFRS도입 이후 ~ 코로나 이전)
  • 대상종목 : KOSPI & KOSDAQ 상장기업
  • 제거 종목 : 금융 및 보험업, 스팩주, 상장폐지, 외국계기업
  • 선정 피쳐 : 총 80개(재무재표데이터 + 파생변수 + 주가데이터)

1. Preprocessing

  • 거래소코드가 2개인 기업(26개) 중복 제거
  • 회사명이 2개인 거래소코드 중복 확인
  • 데이터가 하나 밖에 없는 기업 데이터 삭제
  • 연결제무재표데이터 별도제무재표데이터로 대체
  • 999999 (inf, -inf) 제거(이자보상배율 제외)
  • 이자보상배율의 inf 값은 winsorizing 처리
  • 양극단치 2.5%씩 winsorizing(Object 피쳐 제외)
  • 파생변수(증가율) 이상치 처리
    • 전년도, 올해 값이 존재할 경우 증가율 컬럼 생성
    • 전년도(0) & 올해(0) : 증가율 =0
    • 전년도(0) & 올해(0이상) : drop
    • inf가 많이 생성되는 컬럼은 drop
  • 잠재한계기업(2년 연속 이자보상배율이 1미만인 기업)으로 필터링
    • 기업당 데이터는 1개(최초 잠재한계 데이터만 사용)

2. Labeling

  • Label1 : 한계기업((t+1)년도에 이자보상배율이 1미만인 기업.(3년 연속))
  • Label0 : 회생기업((t+1)년도에 이자보상배율이 1이상인 기업. 즉 잠재한계기업 중 정상화된 기업)

3. Data split & Scaling

  • Train set : 2012 ~ 2016
  • Test set : 2017, 2018
  • Scaling : Train set, test set 각각 Standard scaling(Data Leakage 방지)

4. Feature Selection

  • Train set으로만 Feature Selection
  • 검정
    • 정규성검정(Shapiro, Anderson, KS test, Jarque_bera test, Normal test, Dist plot, qq plot)
    • 독립성검정(Durbin-Watson)
    • 등분산검정(Bartlett test)
  • 아래 4개 모델 중 3개 이상 중복 피쳐를 최종 선택
    • T-test(통계분석)
    • Lasso(Wrapper Method)
    • Stepwise(Embbeded Method)
    • Kbest(Filter Method)

3. Modeling

[단일분류]

  • Logistic
  • KNN
  • Decision Tree
  • Naive Bayes
  • SVM

[Ensamble]

  • Random Forest - XGB
  • LGBM
  • Voting
  • Stacking

[Deeplearning]

  • TabNet

-> 최종모델 : XGBClaasifier

4. Evaluation(Test set)

  • ACC : 0,73
  • Precision : 0.73
  • Recall : 0.97
  • F1-score : 0.83
  • AUC : 0.59

[Recall이 상대적으로 높은 성능을 보이는 모델]

  • 이를 통해 한계기업으로 많이 예측하여 회생기업이라고 잘못 예측했을 때의 리스크를 줄임
  • 회생기업(0)의 관점에서는 확실한 회생기업만 회생이라고 예측하기에 투자에 활용하기 좋은 모델

5. 투자

  • 백테스팅 기간 : 2013.04~2019.12(회계년도기준 (t+1)년 4월부터 (t+2)년 3월까지)
  • 투자유니버스 : 2012~2018 중 예상회생기업
  • 벤치마크 : 투자유니버스의 전종목 동등비중/Buy&Hold 수익률

[백테스팅]

  • 연도마다 총 15(3x5)가지의 투자

  • 종목별 투자비중(3) : 동등비중 / 샤프지수 최대화 / 리스크 최소화

  • 매매전략 : Buy&Hold / 추세추종1/ 추세추종2 / 추세추종3 / 역추세

  • 평가

    • 벤치마크와 CAGR/ Sharpe ratio로 비교평가(매년)

-> 동등비중 x 역추세 전략이 최적

(*아래 ppt예시)

슬라이드7

슬라이드59

슬라이드62

슬라이드67

슬라이드87

슬라이드89

About

UBION Project2 RETURNUP / 22.12.01 ~ 23.01.03

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published