My Implementation of Hybrid Reward Architecture

これは、NIPS2017で発表された論文 "Hybrid Reward Architecture for Reinforcement Learning" で提案されたモデルである Hybrid Reward Architecture (HRA) を、授業の課題として実装したものです。

この論文中の "Experiment 4.1: Fruit Collection Task" と同様の実験を行えるように実装しました。HRAとDQNは自分で実装しましたが、ゲームの環境については再現性を損なわないようにオリジナルの公開コードをベースに、少し変更を加えて作成しました。

Dependencies

本コードを実行させるのに必要な環境とライブラリの一覧です。

DQNは、HRAとの比較用に用意しました。

HRAは、もっとも単純な実装であるhraと、ドメイン知識を活用したhra+1とhra+2を用意しました。

python ./dqn/train.py

python ./hra/train.py --mode hra

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
dqn		dqn
environment		environment
hra		hra
.gitignore		.gitignore
README.md		README.md