Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Robo-dopamin: Průlom v robotické přesnosti – procesní odměny, které napodobují lidskou intuici!
Tento průlomový článek představuje Robo-Dopamin, rámec, který posouvá robotické učení od hrubých odměn založených na výsledcích k sofistikovaným, procesně orientovaným odměnám.
Trénováním na obrovském datovém souboru s více zobrazeními o 3 400+ hodinách dosahuje jejich General Reward Model (GRM) 92,8% přesnosti při hodnocení pokroku manipulace, spojuje perspektivy pro zvládání okluzí a jemných detailů jako nikdy předtím.
Při reálných testech napříč úkoly jako je skládání ručníků nebo skládání kostek jejich politika Dopamine-RL vystřelí na 95 % při pouhých 150 zavedení – to je asi hodina robotického času!
Zajímavé postřehy:
• Vyhýbá se "sémantické pasti" v tradičním formování odměn, zajišťuje, že politiky se optimalizují, aniž by uvízly v suboptimálních smyčkách – teoretický úspěch pro spolehlivou AI.
• Velmi zobecňuje: Od simulátora k reálným, neviditelným objektům a rozvržení, klesá jen o 8-20 % v scénářích OOD oproti konkurentům 50-60 %.
• Důsledky? Chirurgové, továrny a domácí asistenti brzy dokázali zvládat jemné operace s lidskou jemností, s drobnými chybami a časem na výcvik.
Dnes to budu testovat!
Celý text: –

Top
Hodnocení
Oblíbené
