NVIDIA vient de publier un article incroyable sur la façon dont ils ont compressé un modèle de 16 bits à 4 bits tout en maintenant une précision de 99,4 %, ce qui est pratiquement sans perte. C'est un incontournable. Lien ci-dessous.