NVIDIAはモデルを16ビットから4ビットに圧縮し、99.4%の精度を維持したという素晴らしい論文を発表しました。これはほぼロスレスです。 これは必読です。以下にリンクがあります。