Releases · rlberry-py/rlberry · GitHub

01 Oct 20:14

omardrwch

rlberry-v0.2 Pre-release

Pre-release

Improving interface and tools for parallel execution (#50)

AgentStats renamed to AgentManager.
AgentManager can handle agents that cannot be pickled.
Agent interface requires eval() method instead of policy() to handle more general agents (e.g. reward-free, POMDPs etc).
Multi-processing and multi-threading are now done with ProcessPoolExecutor and ThreadPoolExecutor (allowing nested processes for example). Processes are created with spawn (jax does not work with fork, see #51).

New experimental features (see #51, #62)

JAX implementation of DQN and replay buffer using reverb.
rlberry.network: server and client interfaces to exchange messages via sockets.
RemoteAgentManager to train agents in a remote server and gather the results locally (using rlberry.network).

Logging and rendering:

Data logging with a new DefaultWriter and improved evaluation and plot methods in rlberry.manager.evaluation.
Fix rendering bug with OpenGL (bf606b4).

Bug fixes.

Assets 2

15 Mar 20:06

xuedong

rlberry-v0.1

feat(project): pre-release test

Assets 2