Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
UUTTA tutkimusta muistin parantamisesta tekoälyagenteille.
(kirjanmerkkeihin)
Kun kontekstiikkunat skaalaavat miljooniin tokeneihin, pullonkaula siirtyy raakakapasiteetista kognitiiviseen kontrolliin. On tärkeämpää tietää mitä tietää, tietää mitä puuttuu, ja tietää, milloin lopettaa, kuin jokaisen tokenin käsittely.
Pidemmät kontekstiikkunat eivät takaa parempaa päättelyä. Tämä johtuu pitkälti siitä, että kehittäjät käsittelevät ultrapitkiä dokumentteja nykyään kontekstin laajentamiseen tai kaiken pakkaamiseen yhteen kertaan.
Mutta kun ratkaisevaa näyttöä on niukasti ja hajallaan miljoonan tokenin keskellä, passiiviset muististrategiat hylkäävät hiljaisesti monihyppäämiseen tarvittavat sillan yhdistävät faktat.
Tämä uusi tutkimus esittelee InfMemin, rajoitetun muistin agentin, joka soveltaa System-2-tyylistä kognitiivista ohjausta pitkien dokumenttien kysymysten vastaamiseen rakenteellisen PRETHINK–RETRIEVE–WRITE -protokollan avulla.
Sen sijaan, että jokainen segmentti pakkaisi passiivisesti virran aikana, InfMem seuraa aktiivisesti, riittääkö sen muisti vastaamaan kysymykseen. Ovatko nykyiset todisteet riittävät? Mitä puuttuu? Mistä asiakirjasta minun pitäisi etsiä?
PRETHINK toimii kognitiivisena ohjaajana, päättäen, pysäytetäänkö vai haketaanko lisää todisteita. Kun todisteiden aukkoja on, se synteesi kohdennetun hakukyselyn ja hakee olennaisia kohtia mistä tahansa asiakirjasta, mukaan lukien aiemmat kohdat, jotka se on jo läpäissyt. WRITE suorittaa sitten yhteispakkauksen, integroiden haetun todisteen nykyiseen segmenttiin rajattuun muistiin kiinteällä budjetilla.
Harjoitusresepti käyttää SFT-lämmittelyä protokollan mekaniikan opettamiseen Qwen3-32B:n tislaamisen kautta, minkä jälkeen vahvistusoppiminen yhdistää palautuksen, kirjoittamisen ja pysäytyksen päätökset lopputehtävän oikeellisuuteen lopputulospohjaisten palkintojen ja varhaisen pysäytyksen muotoilun avulla.
Ultra-pitkissä QA-vertailuissa, 32k:sta 1M:een, InfMem päihittää MemAgentin +10,17, +11,84 ja +8,23 keskimääräisellä absoluuttisella tarkkuudella Qwen3-1.7B:llä, Qwen3-4B:llä ja Qwen2.5-7B:llä.
4B-parametrinen InfMem-agentti ylläpitää johdonmukaista tarkkuutta jopa 1 miljoonan tokenin tarkkuudella, jossa standardilähtökohdat kuten YaRN romahtavat yksinumeroiseksi suorituskyvyksi. Päättelyviive laskee keskimäärin 3,9-kertaiseksi (jopa 5,1-kertaiseksi) adaptiivisen varhaisen pysäytyksen avulla.
Nämä edistysaskeleet siirtyvät myös LongBenchin laadunvarmistukseen, jossa InfMem+RL saavuttaa jopa +31,38 absoluuttisen parannuksen yksittäisissä tehtävissä verrattuna YaRN:n perustasoon.
Artikkeli:
Opettele rakentamaan tehokkaita tekoälyagentteja akatemiassamme:

Johtavat
Rankkaus
Suosikit
