- 크롤링 전체적인 틀은 완성됬는데 변경해야할 사항들이 많음
- 크롤링 사용은 코드 2개로 구분되어있음
-
- settting(), run()
-
- setting -> 세팅(csv파일생성 및 스텟종류 세팅) run -> 데이터 수집(경기 Performance Stats수집)
- Dash Library를 통해 DashBoard 구성할 예정 (Flask질문한 이유도 여기에 있음)
- 가장 중요한 회귀분석을 해야하는데 Elastic Net을 통해 정규화는 진행할 예정
- But... 저번 Linear Regression(선형 회귀)이 아닌 Poly Regression(다차항 회귀)를 잘 못 말함(x축은 나이이고 y축은 회의를 통해 결정)
- 수식은 완성되면 업데이트
scrapping.py 설명
Crawling → Scrapped로 클래스명 변경 Scrapped를 호출해야 사용가능
attack, pitcher, defense 세 가지의 함수가 존재
함수들은 각각 해당되는 옛날 전성기 선수들의 스텟을 가져옴
다항회귀를 선택 그 전과 동일하게 Elastic Net을 사용할 예정임
But 데이터 분석하다보면 RNN도 해볼 만 할지도?
pip install pipenv → 가상환경 구축
pipenv install → 필수요소들 설치
pipenv shell → 실행
- 수식은 다음과 같이 구현
$\displaystyle\sum_{i=0}^{i=len(years)}{(x_i-y_i)}$ - Dash_Library 통해 선수예측스텟들 확인가능(Herokku배포)
Python Selenium
Dash_Library(Flask)
Scikit-learn(ElasticNet)