NVIDIA släppte precis en fantastisk artikel om hur de komprimerade en modell från 16-bit till 4-bit och kunde behålla 99,4 % noggrannhet, vilket i princip är förlustfritt. Det här är ett måste att läsa. Länk nedan.