La distillation consciente de la quantification (QAD) offre une précision proche de BF16 avec NVFP4 ! Un travail incroyable dirigé par @huizi_mao