- Tên môn học: TOÁN CHO KHOA HỌC MÁY TÍNH - MATH FOR CS
- Mã môn học: CS115
- Mã lớp: CS115.P11
- Năm học: HK1 (2024 - 2025)
- Giảng viên: TS. Dương Việt Hằng - [email protected]
STT | Họ tên | MSSV | Vai trò | |
---|---|---|---|---|
1 | Võ Anh Kiệt | 23520825 | Thành viên | [email protected] |
2 | Lê Phú Quý | 23521316 | Thành viên | [email protected] |
3 | Trần Tuấn Kiệt | 23520822 | Thành viên | [email protected] |
4 | Phạm Tài Lộc | 23520865 | Thành viên | [email protected] |
- Tên đề tài: Policy Gradient For Reinforcement Learning
- Mô tả đề tài: Xây dựng một mô hình Reinforcement Learning với cách tiếp cận Policy-based là Policy Gradient Method.
- Language: Python 3
- Library:
gym
pytorch
numpy
itertools
git clone https://github.com/ToiLaKiet/UIT-CS115.git
cd UIT-CS115
pip install -r requirements.txt
- Huấn luyện Model chơi game Cart Pole
Full demo: https://shorturl.at/5AGUW