Skip to content

lukucz/myhra

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 

Repository files navigation

My Implementation of Hybrid Reward Architecture

これは、NIPS2017で発表された論文 "Hybrid Reward Architecture for Reinforcement Learning" で提案されたモデルである Hybrid Reward Architecture (HRA) を、授業の課題として実装したものです。

この論文中の "Experiment 4.1: Fruit Collection Task" と同様の実験を行えるように実装しました。HRAとDQNは自分で実装しましたが、ゲームの環境については再現性を損なわないようにオリジナルの公開コードをベースに、少し変更を加えて作成しました。

Dependencies

本コードを実行させるのに必要な環境とライブラリの一覧です。

  • Python 3.5 or higher
  • numpy (pip install numpy)
  • click (pip install click)
  • pyyaml (pip install pyyaml)
  • TensorFlow 1.8+

Usage

DQNは、HRAとの比較用に用意しました。

HRAは、もっとも単純な実装であるhraと、ドメイン知識を活用したhra+1hra+2を用意しました。

  • DQN:
python ./dqn/train.py
  • HRA:
python ./hra/train.py --mode hra
  • --mode can be either of hra, hra+1, or hra+2.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages