Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GROOT KV-CACHE GEHEUGEN FIX
Los het KV-cache probleem van GLM-4.7-Flash op
met deze enkele regel wijziging in vLLM
200K context neemt nu ~10GB VRAM
in plaats van ~180GB
NVFP4 is nu op HF*
- ~20,4GB gewichten
- Bijna geen verlies ten opzichte van 62,4GB BF16
Dit SOTA-model draait nu op
eén enkele RTX 5090 (32GB VRAM)
> met de volledige 200K context
> VRAM nog over
*HF: GadflyII/GLM-4.7-Flash-NVFP4

Boven
Positie
Favorieten
