imoneoi

Follow

🎯

Tuning PPO

One imoneoi

🎯

Tuning PPO

Follow

Professional RL(HF) hyperparameter tuner

339 followers · 4 following

http://imone.me

Achievements

Achievements

Organizations

Pinned Loading

openchat openchat Public

OpenChat: Advancing Open-source Language Models with Imperfect Data

Python 5.4k 424
multipack_sampler multipack_sampler Public

Multipack distributed sampler for fast padding-free training of LLMs

Python 198 16
EvolvingConnectivity EvolvingConnectivity Public

Code for paper Evolving Connectivity for Spiking Neural Networks

Python 21 3
RSP_JAX RSP_JAX Public

[AAAI'25 Oral] Are Expressive Models Truly Necessary for Offline RL?

Python 11 4