NVIDIA acaba de publicar un artículo excelente sobre cómo comprimieron un modelo de 16 bits a 4 bits y lograron mantener una precisión del 99,4%, que es básicamente sin pérdidas. Es una lectura obligada. Enlace abajo.