rl-ray-demo

Installation

Many ways of setting up a python environment. A local venv from scratch is often the most reliable:

python -m venv venv
source venv/bin/activate
pip install ray[rllib] ray[tune] tensorboard
pip install git+https://github.com/boettiger-lab/gym_fishing

Getting started

Tensorboard

simlink ~/ray_results to /var/log/tensorboard/<username>, e.g.

ln -s ~/ray_results/ /var/log/tensorboard/cboettig

(on containers not hosting the tensorboard, simlink will not be read)

Admin

(Docker host administrator only, e.g. see https://github.com/boettiger-lab/servers for more details)

Make sure tensorboard is running on the server. (Usually in the primary rstudio container).

tensorboard --logdir /var/log/tensorboard --bind_all --port 2223

Make sure Caddyfile is exposing tensorboard URL (e.g. https://tensorboard.cirrus.carlboettiger.info)
above can be moved into /etc/services.d/tensorboard/run as:

#!/usr/bin/with-contenv bash
# place this file in /etc/services.d/tensorboard/run   
tensorboard --logdir /var/log/tensorboard/ --bind_all --port 2223

GPU

Monitor GPU use locally with nvitop, installable with pip.
(Or go old-school watch -n 3 nvidia-smi).

If you see Failed to initialize NVML: Driver/library version mismatch, container probably needs to be restarted (e.g. after driver updates on the host machine.)

Admin: If mismatch occurs on host, stop all tasks using the GPU (gdm, monitors, containers, etc) and recursively unload modules, usually:

sudo rmmod nvidia_drm
sudo rmmod nvidia_modeset
sudo rmmod nvidia_uvm
sudo rmmod nvidia

Alternatively, just reboot the machine.

If GPU is being lost from container without update, make sure devices are hard-wired in docker runtime:

docker run ...
  --device /dev/nvidiactl:/dev/nvidiactl \
  --device /dev/nvidia-uvm:/dev/nvidia-uvm \
  --device /dev/nvidia0:/dev/nvidia0

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
examples		examples
saved_checkpoint		saved_checkpoint
.fishing.sh.swp		.fishing.sh.swp
.gitignore		.gitignore
LICENSE		LICENSE
Pipfile		Pipfile
README.md		README.md
cons-PPO-LSTM.yml		cons-PPO-LSTM.yml
cons-PPO.yml		cons-PPO.yml
conservation.ipynb		conservation.ipynb
conservation.py		conservation.py
custom_env.ipynb		custom_env.ipynb
demo.ipynb		demo.ipynb
demo.py		demo.py
eval.ipynb		eval.ipynb
fishing-ARS-config.yml		fishing-ARS-config.yml
fishing-PPO-config.yml		fishing-PPO-config.yml
fishing-basic-config.yml		fishing-basic-config.yml
fishing.ipynb		fishing.ipynb
fishing.py		fishing.py
fishing.sh		fishing.sh
lstm.ipynb		lstm.ipynb
ray-lstm.py		ray-lstm.py
rl-ray-demo.Rproj		rl-ray-demo.Rproj
score.py		score.py
tensorboard.sh		tensorboard.sh
train.py		train.py
train2.py		train2.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

rl-ray-demo

Installation

Getting started

Tensorboard

GPU

About

Releases

Packages

Languages

License

cboettig/rl-ray-demo

Folders and files

Latest commit

History

Repository files navigation

rl-ray-demo

Installation

Getting started

Tensorboard

GPU

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages