NVIDIA vừa phát hành một bài báo ấn tượng về cách họ nén một mô hình từ 16-bit xuống 4-bit và vẫn duy trì được độ chính xác 99,4%, điều này gần như là không mất mát. Đây là một bài đọc không thể bỏ qua. Liên kết bên dưới.