Pretrain with Llama3.1-70b #1828

sadrafh · 2024-11-12T22:21:21Z

I am using litgpt to pretrain Llama3.1-70b with 4 nodes each having 8 h100 Gpus but still I am getting Cuda out of memory error. Also what pytorch version should I use? I am using global batch_size 8, and mini batch size 1

Any suggestions for this case?

sadrafh added the question Further information is requested label Nov 12, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Pretrain with Llama3.1-70b #1828

Pretrain with Llama3.1-70b #1828

sadrafh commented Nov 12, 2024 •

edited

Loading

Pretrain with Llama3.1-70b #1828

Pretrain with Llama3.1-70b #1828

Comments

sadrafh commented Nov 12, 2024 • edited Loading

sadrafh commented Nov 12, 2024 •

edited

Loading