Skip to content

Final Project for UIT-CS115 with the topic of Policy Gradient For Reinforcement Learning

Notifications You must be signed in to change notification settings

ToiLaKiet/UIT-CS115

Repository files navigation

Trường Đại học Công nghệ Thông tin | University of Information Technology

CS115 - TOÁN CHO KHOA HỌC MÁY TÍNH

MATH FOR COMPUTER SCIENCE

Status GitHub contributors Status

BẢNG MỤC LỤC

GIỚI THIỆU MÔN HỌC

  • Tên môn học: TOÁN CHO KHOA HỌC MÁY TÍNH - MATH FOR CS
  • Mã môn học: CS115
  • Mã lớp: CS115.P11
  • Năm học: HK1 (2024 - 2025)
  • Giảng viên: TS. Dương Việt Hằng - [email protected]

GIỚI THIỆU NHÓM

STT Họ tên MSSV Vai trò Email
1 Võ Anh Kiệt 23520825 Thành viên [email protected]
2 Lê Phú Quý 23521316 Thành viên [email protected]
3 Trần Tuấn Kiệt 23520822 Thành viên [email protected]
4 Phạm Tài Lộc 23520865 Thành viên [email protected]

GIỚI THIỆU ĐỀ TÀI

  • Tên đề tài: Policy Gradient For Reinforcement Learning
  • Mô tả đề tài: Xây dựng một mô hình Reinforcement Learning với cách tiếp cận Policy-based là Policy Gradient Method.

Requirements

  • Language: Python 3
  • Library:
gym
pytorch
numpy
itertools

Installation

git clone https://github.com/ToiLaKiet/UIT-CS115.git
cd UIT-CS115
pip install -r requirements.txt

Usage

  • Huấn luyện Model chơi game Cart Pole

DEMO

Full demo: https://shorturl.at/5AGUW

About

Final Project for UIT-CS115 with the topic of Policy Gradient For Reinforcement Learning

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published