NVIDIA baru saja menjatuhkan makalah banger tentang bagaimana mereka mengompresi model dari 16-bit ke 4-bit dan mampu mempertahankan akurasi 99,4%, yang pada dasarnya lossless. Ini harus dibaca. Tautan di bawah ini.