"Seuraavan tokenin ennuste" sai juuri vakavan kilpailijan 🤯 Ant Group julkaisi juuri LLaDA 2.1:n, ja se haastaa hallitsevan LLM-paradigman. Toisin kuin useimmat mallit, jotka tuottavat yhden tokenin kerrallaan, LLaDA 2.1 käyttää diffuusiota tekstilohkojen rinnakkaiseen tuottamiseen. Miksi tämä muuttaa kaiken:  → Globaali suunnittelu: Se näkee käytännössä "tulevaisuuden" samalla kun kirjoittaa "menneisyyttä" → Rinnakkainen generointi: Se tuottaa lohkoja rinnakkain, ei peräkkäin, ollen paljon nopeampi → Massiivinen tehokkuus: 16B MoE-arkkitehtuuri, joka käyttää vain ~1,4B aktiivista parametria per askel. 100 % avoimen lähdekoodin.