Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Robotika stále naráží na stejnou zeď.
Single task RL funguje, ale... Neškáluje se na stovky úkolů ani nových ztělesnění.
Tento nový článek vypadá jako skutečný krok k nápravě.
Tým představuje MMBench, benchmark s 200 úkoly napříč mnoha doménami a roboty, a Newt, jazykově podmíněný světový model trénovaný online napříč všemi 200 úlohami najednou.
Jednoduchá myšlenka za Newtem:
Model se učí z ukázek, aby získal správné předpoklady
Trénuje v mnoha úkolech prostřednictvím online interakce
Používá jazyk k ukotvení cíle
Rychle se přizpůsobí, když se objeví nový úkol
Co mě zaujalo:
✅ Jeden model trénovaný na 200 úlohách současně
✅ Jazykově podmíněné řízení pro oba stavy i RGB
✅ Lepší efektivita dat než silné základní hodnoty
✅ Silná otevřená smyčka řízení
✅ Rychlá adaptace na nové úkoly a ztělesnění
✅ Plné vydání 200 kontrolních bodů, 4000 dem, kódu a benchmarku
To je dobrý impuls k obecnému řízení místo jednoho modelu na úkol.
Pokud chcete celý článek:
Stránka projektu:
—-...
Top
Hodnocení
Oblíbené

