Guidance on using lower precision ("quantization") for deep learning #63

qualiaMachine · 2024-08-16T20:02:45Z

Deep learning is very resource intensive. A common trick to reduce compute needs is to lower the precision of your data (e.g., from float32 to float16). Alternatively, there are options to use automatic mixed precision via torch.amp. We should provide some guidelines on the impact of lowering precision (e.g., during training vs. during inference). Provide references/evidence to support these guidelines.

qualiaMachine added the resource label Aug 16, 2024

qualiaMachine changed the title ~~Guidance on using lower precision for deep learning~~ Guidance on using lower precision ("quantization") for deep learning Aug 21, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Guidance on using lower precision ("quantization") for deep learning #63

Guidance on using lower precision ("quantization") for deep learning #63

qualiaMachine commented Aug 16, 2024

Guidance on using lower precision ("quantization") for deep learning #63

Guidance on using lower precision ("quantization") for deep learning #63

Comments

qualiaMachine commented Aug 16, 2024