VIKTIG KV-CACHE MINNEFIKS Fiks KV-cachen til GLM-4.7-Flash med denne enkeltlinjeendringen i vLLM 200K kontekst krever nå ~10GB VRAM i stedet for ~180GB NVFP4 er nå på HF* - ~20,4GB vekter - Nesten null tap mot 62,4GB BF16 Denne SOTA-modellen kjører nå på en enkelt RTX 5090 (32GB VRAM) > med hele 200K-konteksten > VRAM fortsatt igjen *HF: GadflyII/GLM-4.7-Flash-NVFP4