Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
LLM-päättely on monen miljardin dollarin kysymys.
Uusi artikkelimme esittelee SOTA-algoritmin moniluonnoksen spekulatiivisessa otannassa, Global Resolutionin, joka tekee merkittäviä edistysaskeleita tässä ongelmassa.
Purkaminen alla 🧵👇
Yksi tehokkaan päättelyn lähestymistapa on ns. spekulatiivinen otanta.
Tässä käytetään halpaa 'luonnosmallia', jolla saadaan 'arvauksia' siitä, mitä suurempi kohdemalli tuottaisi.
Hyödyntämällä nykyaikaisten GPU:iden rinnakkaisuustehokkuutta tämä voi vähentää kohdemallin eteenpäin syöttöjen määrää yli 5-kertaiseksi.
Spekulatiivinen otanta voidaan yleistää sisältämään useita arvauksia useista luonnosmalleista.
Mutta ei ole selvää, mikä on paras algoritmi näiden useiden arvausten yhdistämiseen.
Yksivaiheisessa tapauksessa aiempi tutkimus on osoittanut, että optimaalinen ratkaisu löytyy ratkaisemalla optimaalinen kuljetuslineaarinen ohjelma, OTLP.
OTLP:n ratkaiseminen on kuitenkin erittäin vaikeaa, sillä se kasvaa eksponentiaalisesti sanavarastossa. Joten miten voimme ratkaista sen?
Avain on hyödyntää lisärakennetta luonnospuun rakenteessa.
Aiemmat tutkimukset [Hu ym.] osoittivat, että kun luonnospuu muodostetaan i.i.d.-näytteenotannalla, dualisoimalla OTLP, optimaalinen tavoitearvo voidaan laskea lähes lineaarisessa ajassa submodulaarisen minimoinnin avulla.
Kuitenkin ennen työtämme mikään menetelmä ei pystynyt ratkaisemaan ratkaisua, joka saavuttaisi tämän optimaalisen tavoitearvon. Ilman tätä puuttuvaa osaa ainoa aiempi työ antaa meille lohkotehokkuuden, teoreettisen maksiminopeuden. Se ei kerro, miten tämä nopeus saavutetaan.
Työmme on ensimmäinen, joka merkittävästi pienentää OTLP:n ulottuvuutta kolmen oivalluksen avulla.
Käänsimme OTLP:n dualisaation aiemmassa työssä [Hu ym.] komplementaarisella löysyydellä, muodostaaksemme OTLP:n virtaustoteutettavuusongelmaksi.
Monet virtausepäyhtälöiden rajoitteet ovat tarpeettomia. Polymatroiditeorian ahneen algoritmin avulla voimme yhdistää nämä.
Tälle supistetulle virtausongelmalle on ratkaisu, joka voidaan parametrisoida matalaulotteisen vektorin softmaxiksi, ja tämä vektori voidaan laskea konveksin minimoinnin avulla.
Tämä vähentää V^{n+1} muuttujien OTLP:n konveksi minimointiongelmaksi V-muuttujassa.
V voi kuitenkin silti olla melko suuri, joten artikkelissamme sovellamme lisäapproksimaatioita rajoitetulla kohdemallin virheprosentilla vähentääksemme laskenta-aikaa entisestään.

Monissa tapauksissa, joissa V rajoittuu yläk- ja n-luonnosmalleihin, kuten yllä on esitetty, Global Resolution on _ainoa_ ratkaisija, joka pystyy ratkaisemaan OTLP:n kohtuullisessa ajassa.
Lisäksi Global Resolutionin avulla voimme parantaa Llaman ja Gemman hyväksymisprosentteja jopa 6 %:lla:
Lyhyesti sanottuna Global Resolution on SOTA optimaalisen moniluonnoksen varmennuksessa spekulatiivisessa dekoodauksessa.

Täällä on vielä paljon tehtävää, löysittää iid-asetusta tai laajentaa useampaan vaiheeseen.
5,82K
Johtavat
Rankkaus
Suosikit

