Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Robotica se lovește mereu de același zid.
O singură sarcină în viața reală funcționează, dar... Nu se scalează la sute de sarcini sau noi întruchipări.
Această nouă lucrare pare un pas real spre remedierea acestei situații.
Echipa introduce MMBench, un benchmark cu 200 de sarcini în multe domenii și roboți, și Newt, un model de lume dependent de limbaj, antrenat online pe toate cele 200 de sarcini simultan.
Ideea simplă din spatele lui Newt:
Modelul învață din demonstrații pentru a obține prior-urile corecte
Se antrenează pe multe sarcini prin interacțiune online
Folosește limbajul pentru a ancora scopul
Se adaptează rapid când apare o nouă sarcină
Ce mi-a atras atenția:
✅ Un model antrenat simultan pe 200 de sarcini
✅ Control condiționat de limbaj pentru ambele stări și RGB
✅ Eficiență mai bună a datelor decât baze de bază solide
✅ Control puternic în buclă deschisă
✅ Adaptare rapidă la noi sarcini și întruchipări
✅ Lansarea completă a 200 de puncte de control, 4000 de demo-uri, cod și benchmark
Aceasta este o mișcare bună spre controlul general, în loc de un model pe sarcină.
Dacă vrei lucrarea completă:
Pagina proiectului:
—-...
Limită superioară
Clasament
Favorite

