Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Robo-Dopamina: El cambio radical en precisión robótica – ¡Recompensas de proceso que imitan la intuición humana!
Este artículo pionero introduce la Robo-Dopamina, un marco que transforma el aprendizaje robótico de recompensas basadas en resultados rudimentarios a sofisticadas orientadas al proceso.
Al entrenar con un enorme conjunto de datos multivista de 3.400+ horas, su Modelo General de Recompensa (GRM) logra un 92,8% de precisión en la evaluación del progreso de la manipulación, fusionando perspectivas para manejar oclusiones y detalles finos como nunca antes.
En pruebas reales sobre tareas como doblar toallas o apilar cubos, su política de Dopamina-RL dispara las tasas de éxito hasta el 95% con solo 150 despliegues, ¡eso equivale a aproximadamente una hora de tiempo de robot!
Perspectivas interesantes:
• Evita la "trampa semántica" en la configuración tradicional de recompensas, asegurando que las políticas se optimicen sin quedar atrapadas en bucles subóptimos, una victoria teórica para una IA fiable.
•Generaliza mucho: de simulador a objetos reales y invisibles, y distribuciones, bajando solo entre un 8 y un 20% en escenarios fuera de la vista frente al 50-60% de los competidores.
•¿Implicaciones? Cirujanos, fábricas y asistentes domésticos pronto podrían manejar operaciones delicadas con una destreza humana, recortando errores y tiempo de entrenamiento.
¡Voy a probar esto hoy!
Artículo completo: –

Populares
Ranking
Favoritas
