List of Contents

Algorithms

Q-Value based

Replay Buffer

Prioritized Experience Replay (PER)

Distributional

Exploration

Combination

Rainbow [DQN, IQN]

Distributed

Distributed Prioritized Experience Replay (APE-X)
Recurrent Experience Replay in Distributed RL (R2D2)(🚧 implementing…)

Policy Optimization, Actor-Critic

Environments