Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Cercetări noi privind îmbunătățirea auto-reflecției în agenții de limbaj.
O problemă de bază a auto-reflecției agentului este că modelele tind să genereze reflexii repetitive care adaugă zgomot în loc de semnal, afectând performanța generală a raționamentului.
Introduce ParamMem, un modul de memorie parametrică care codifică tiparele de reflexie cross-sample direct în parametrii modelului, apoi folosește eșantionarea controlată de temperatură pentru a genera reflexii diverse la momentul inferenței.
ParamMem arată îmbunătățiri constante față de liniile de bază SOTA în generarea de cod, raționamentul matematic și QA multi-hop. De asemenea, permite transferul de la slab la puternic și auto-îmbunătățirea fără a necesita un model extern mai puternic, ceea ce îl face un upgrade practic pentru pipeline-urile agențice.
Hârtie:
Învață să construiești agenți AI eficienți în academia noastră:

Limită superioară
Clasament
Favorite
