Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Je kunt AI-inferentie 3x sneller maken zonder extra training.
Onderzoekers van SJTU & Huawei presenteren LoPA speciaal daarvoor!
Hun nieuwe "Lookahead Parallel Decoding"-methode is een plug-and-play truc. Het voorspelt slim de beste volgorde om meerdere tokens tegelijk te genereren, in plaats van één voor één, waardoor enorme parallelle berekeningen mogelijk worden.
Het geeft de D2F-Dream-model een boost om 10+ tokens per stap uit te voeren, met meer dan 1070 tokens/sec—significant beter presterend dan andere top-inferentiesystemen op codering (MBPP) en wiskunde (GSM8K) benchmarks.
LoPA: Schalen van dLLM-inferentie via Lookahead Parallel Decoding
Paper:
Code:
Blog:
Ons rapport:
📬 #PapersAccepted door Jiqizhixin

Boven
Positie
Favorieten
