Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Olemme innoissamme voidessamme jakaa tuoreen tutkimuksemme AutoJudgesta, dekoodaustekniikasta, joka yhdistää:
- Päättelyn kiihdytys jakaumayhteensopivuusrajoitteen löyhentämisen kautta
- Helppokäyttöisyys ja skaalautuvuus itseohjatun koulutusprotokollan ansiosta
Esittelen #NeurIPS2025 tänään! (1/9)

Huomaamme, että voimme louhia hyväksymisluokittelijan etikettejä automaattisesti. Tarkemmin sanottuna otamme aineiston ja ajamme kohde- ja luonnosmallien generointia.
Sen jälkeen tarkistamme kaikki kohde- ja draft-mallien väliset epäsopivat tokenit. Jos tokenin jättäminen luonnosmallista johtaa väärään vastaukseen, se merkitään tärkeäksi (3/9)

Näiden tunnisteiden avulla voimme kouluttaa yksinkertaisen luokittelijan löytämään tärkeitä tokeneita päättelyajankohtana.
Jos alkuperäinen spekulatiivinen dekoodaus hylkäisi tokenin, annamme sille toisen mahdollisuuden kysymällä luokittelijalta. Ei-tärkeille tokeneille jatketaan generointia, mutta toisille aloitamme uuden spekulatiivisen syklin (4/9)

Pääasialliset AutoJudgen arvioinnit keskittyvät tehtäviin, joiden oikeellisuutta on helppo mitata — ohjelmointi (LiveCodeBench) ja matematiikka (GSM8K).
Mallipareilla, kuten 8B/70B, voimme saavuttaa jopa 40 hyväksyttyä tokenia per syklin ja tarkkuus on <1 %! (5/9)

AutoJudge integroituu myös helposti avoimen lähdekoodin päättelykehyksiin, kuten vLLM. Hyväksymisprosentin parannukset näkyvät päästä päähän nopeutetuiksi: jos vaihdamme 2 % tarkkuudesta, saamme lähes 50 % enemmän tokeneita sekunnissa! (6/9)

Tärkeiden tokenien annotaatioiden tarkastelu paljastaa mielenkiintoisen kaavan: selkeät virheet merkitään negatiivisiksi näytteiksi (=> täytyy regeneroida), kun taas semanttisesti ekvivalentit tokenit mahdollistavat spekuloinnin etenemisen (7/9)

Lisätietoja saat katsomalla:
Paperi:
Koodi:
Blogikirjoitus:
Esilasketut aktivointi GSM8K:lle ja LiveCodeBenchille:
(8/9)
Tätä työtä johti upeat kanssakirjoittajani @garipovroma, @MightyNeighbour, Ivan Ermakov, Ruslan Svirschevski ja Vage Egiazarian.
Tiimi on tällä viikolla San Diegossa NeurIPS-tapahtumassa — tule tervehtimään tänään julistetilaisuuteen!
16:30, juliste #2010 (9/9)
2,52K
Johtavat
Rankkaus
Suosikit

