O NVFP4 já está disponível no HF* Os pesos chegam a ~20,4GB Imagine rodar isso em uma RTX 5090 (32GB de VRAM) com perda quase zero de desempenho ou precisão contra 62,4GB *HF: GadflyII/GLM-4.7-Flash-NVFP4