Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Robotiikka törmää samaan seinään.
Yksittäinen tehtävä RL toimii, mutta... Se ei skaalaudu satoihin tehtäviin tai uusiin ilmentymiin.
Tämä uusi artikkeli vaikuttaa todelliselta askeleelta tämän korjaamiseksi.
Tiimi esittelee MMBenchin, vertailuarvon, jossa on 200 tehtävää monilla eri aloilla ja roboteilla, sekä Newtin, kielellä ehdollistetun maailmanmallin, joka on koulutettu verkossa kaikissa 200 tehtävässä samanaikaisesti.
Newtin yksinkertainen idea:
Malli oppii demoista saadakseen oikeat ennakkotiedot
Se harjoittelee monissa tehtävissä verkko-vuorovaikutuksen kautta
Se käyttää kieltä tavoitteen perustamiseksi
Se sopeutuu nopeasti, kun uusi tehtävä ilmestyy
Mikä jäi mieleeni:
✅ Yksi malli koulutettiin samanaikaisesti 200 tehtävään
✅ Kieliehdollinen ohjaus molemmille tiloille ja RGB:lle
✅ Parempi datatehokkuus kuin vahvat lähtötasot
✅ Vahva avoimen silmukan ohjaus
✅ Nopea sopeutuminen uusiin tehtäviin ja toteutuksiin
✅ Täysi julkaisu: 200 tarkistuspistettä, 4000 demoa, koodia ja benchmarkia
Tämä on hyvä ponnistus yleiseen hallintaan sen sijaan, että käyttäisit yhtä mallia per tehtävä.
Jos haluat koko artikkelin:
Projektisivu:
—-...
Johtavat
Rankkaus
Suosikit

