Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Robo-Dopamină: Schimbătorul jocului în precizia robotică – Procesele răsplătesc care imită intuiția umană!
Această lucrare revoluționară introduce Robo-Dopamina, un cadru care transformă învățarea robotică de la recompense bazate pe rezultate rudimentare în unele sofisticate, orientate pe proces.
Prin antrenamentul pe un set de date masiv de 3.400+ ore cu mai multe vizualizări, Modelul General de Recompensă (GRM) atinge o acuratețe de 92,8% în evaluarea progresului manipulării, combinând perspectivele pentru a gestiona ocluziile și detaliile fine ca niciodată până acum.
În testele reale pentru sarcini precum plierea prosoapelor sau stivirea cuburilor, politica lor Dopamină-RL crește rapid ratele de succes la 95% cu doar 150 de implementări – asta înseamnă aproximativ o oră de timp pentru robot!
Perspective interesante:
• Evită "capcana semantică" din modelarea tradițională a recompenselor, asigurând optimizarea politicilor fără a rămâne blocate în bucle suboptime – un câștig teoretic pentru AI de încredere.
• Generalizează radical: de la simulator la obiecte reale, nevăzute și layout-uri, scăzând doar cu 8-20% în scenariile OOD față de 50-60% la concurenți.
•Implicații? Chirurgii, fabricile și asistenții de acasă puteau curând să gestioneze operațiunile delicate cu o finețe umană, reducând greșelile și timpul de antrenament.
Astăzi voi testa asta!
Lucrare completă: –

Limită superioară
Clasament
Favorite
