Robotiikka törmää samaan seinään. Yksittäinen tehtävä RL toimii, mutta... Se ei skaalaudu satoihin tehtäviin tai uusiin ilmentymiin. Tämä uusi artikkeli vaikuttaa todelliselta askeleelta tämän korjaamiseksi. Tiimi esittelee MMBenchin, vertailuarvon, jossa on 200 tehtävää monilla eri aloilla ja roboteilla, sekä Newtin, kielellä ehdollistetun maailmanmallin, joka on koulutettu verkossa kaikissa 200 tehtävässä samanaikaisesti. Newtin yksinkertainen idea: Malli oppii demoista saadakseen oikeat ennakkotiedot Se harjoittelee monissa tehtävissä verkko-vuorovaikutuksen kautta Se käyttää kieltä tavoitteen perustamiseksi Se sopeutuu nopeasti, kun uusi tehtävä ilmestyy Mikä jäi mieleeni: ✅ Yksi malli koulutettiin samanaikaisesti 200 tehtävään ✅ Kieliehdollinen ohjaus molemmille tiloille ja RGB:lle ✅ Parempi datatehokkuus kuin vahvat lähtötasot ✅ Vahva avoimen silmukan ohjaus ✅ Nopea sopeutuminen uusiin tehtäviin ja toteutuksiin ✅ Täysi julkaisu: 200 tarkistuspistettä, 4000 demoa, koodia ja benchmarkia Tämä on hyvä ponnistus yleiseen hallintaan sen sijaan, että käyttäisit yhtä mallia per tehtävä. Jos haluat koko artikkelin: Projektisivu: —-...