0/9 Olen iloinen voidessamme esitellä Dynamic Large Concept Models (DLCM), hierarkkisen arkkitehtuurin, joka vie LLM:t tehottoman, yhtenäisen token-tason prosessoinnin ulkopuolelle. Sen sijaan, että ennustattaisiin seuraava alisanatokeni tai kiinteä määrä tokeneita, DLCM generoi dynaamisesti seuraavat käsitteet adaptiivisella rajalla end2end-koulutusparadigman avulla. Rationaalisemmalla dynaamisen laskennan allokaatiolla DLCM voi vähentää päättelyvirheitä 34 % verrattuna tavalliseen tiheään muuntajaarkkitehtuuriin. Ja tehokkuushyöty kasvaa, kun mallin koko ja kontekstin pituus kasvavat.