์ฌ์ฉ์์ ์ฑ ํ์ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ์ฌ์ฉ์์ ํ์ ์ ์์ธก
๐ป Wrap-up Report ๋ฐ๋ก๊ฐ๊ธฐ
Contents
๊ฐ์ํ_T4003 | ๋ฐ๊ฒฝ์ค_T4076 | ๋ฐ์ฉ์ฑ_T4088 | ์คํฌ์ _T4129 | ์ ์๋น_4196 |
---|---|---|---|---|
Github | Github | Github | Github | Github |
[email protected] | [email protected] | [email protected] | [email protected] | [email protected] |
ํ๋ก์ ํธ ์ฃผ์ | ์ฌ์ฉ์์ ์ฑ ํ์ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ์ฌ์ฉ์๊ฐ ์ด๋ค ์ฑ ์ ๋ ์ ํธํ ์ง ์์ธก |
---|---|
ํ๋ก์ ํธ ๊ฐ์ | ๋ถ์คํธ์บ ํ Level1-U stage ๊ฐ์๋ฅผ ํตํด ๋ฐฐ์ด ๋ด์ฉ์ ๋ฐํ์ผ๋ก, ๋ชจ๋ธ์ ์ค๊ณํ๊ณ ํ์ตํ๋ฉฐ ์ถ๋ก ์ ํตํด ๋์จ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํ์ผ๋ก ์์ ์ฐ์ ํ๋ ๋ฐฉ์ |
ํ์ฉ ์ฅ๋น ๋ฐ ์ฌ๋ฃ ย ย ย ย ย ย ย ย | โข ์๋ฒ: Tesla V100, 88GB RAM Server โข ๊ฐ๋ฐ IDE: Jupyter Notebook, VS Code โข ํ์ Tool: Notion, Slack, Zoom |
Metric | RMSE Score |
Dataset | โข books.csv : 149,570๊ฐ์ ์ฑ
(item)์ ๋ํ ์ ๋ณด๋ฅผ ๋ด๊ณ ์๋ ๋ฉํ๋ฐ์ดํฐ โข users.csv : 68,092๋ช ์ ๊ณ ๊ฐ(user)์ ๋ํ ์ ๋ณด๋ฅผ ๋ด๊ณ ์๋ ๋ฉํ๋ฐ์ดํฐ โข train_ratings.csv : 59,803๋ช ์ ์ฌ์ฉ์(user)๊ฐ 129,777๊ฐ์ ์ฑ (item)์ ๋ํด ๋จ๊ธด 306,795๊ฑด์ ํ์ (rating) ๋ฐ์ดํฐ |
๊ธฐ๋ ํจ๊ณผ | ์ฌ์ฉ์์ ์ฑ ํ์ ์ ์์ธกํ๋ ๋ชจ๋ธ์ ๊ฐ๋ฐํ๊ณ , ์ด ๋ชจ๋ธ์ด ์ฌ์ฉ์์๊ฒ ์ฑ ์ ์ถ์ฒํ ๋ ์ข์ ๊ธฐ์ค์ด ๋ ์ ์์ ๊ฒ์ด๋ค. |
ํ๋ก์ ํธ ๊ตฌ์กฐ๋
๋ฐ์ดํฐ ๊ตฌ์กฐ๋
๋ถ๋ฅ | ๋ด์ฉ |
---|---|
์ํคํ ์ฒ | FactorizationMachineModel + FieldAwareFactorizationMachineModel + DeepCrossNetworkModel |
LB์ ์(8/14๋ฑ) ย ย ย ย ย ย ย ย ย | โข public : 2.1407 โข private : 2.1409 |
Training Feature | user_id, isbn, age, publisher, language, location country, year of publication, book author, category (book title, city, state๋ฅผ ์ ์ธํ๊ณ ๋๋จธ์ง๋ฅผ ํ์ต์ ์ฌ์ฉํจ) |
๋ฐ์ดํฐ | โข user_id: ๊ณ ์ ๋ฒํธ โข location: city์ด์ฉํด state, country๊ฒฐ์ธก์น ์ฒ๋ฆฌ โข age: pseudo labeling๋ก ๊ฒฐ์ธก์น ์ฒ๋ฆฌ โข publisher, language: isbn์ด์ฉํด ๊ฒฐ์ธก์น ์ฒ๋ฆฌ |
์์๋ธ ๋ฐฉ๋ฒ | 1๋ฒ ํ์ต ๋ฐฉ๋ฒ์ผ๋ก FM+FFM+HOFM+DCN์ optimal_weighted๋ก ๋ฌถ๊ณ 2๋ฒ ํ์ต ๋ฐฉ๋ฒ์ผ๋ก FM+FFM+DCN์ optimal_weighted๋ก ๋ฌถ๊ณ (1+2)/2 ๋ฐฉ์์ผ๋ก ์์๋ธ์ ์งํํจ. |
private board evaluation
public board evaluation
- requirements :
install requirements
pip install -r requirements.txt
- train & Inference :
main.py
python main.py --MODEL FM --DATA_PATH data
options