He oído esto mucho esta semana en el CES. Los robots para el hogar están al menos a dos años de distancia. Probablemente cinco, dicen muchos. Me encontré con @BradTempleton, quien fue un genio temprano trabajando para @waymo. Me recordó de nuevo que estaba sobreestimando mis capacidades cuando se trata del Robotaxi de Tesla. Pero les dije a todos que mi fecha es abril y no a finales de año como Elon prometió una vez. A él no le gusta cuando hablo de fechas y me dio una buena clase sobre por qué nadie sabe cuándo se resolverá completamente la autonomía. Tengo datos sobre lo que está haciendo la flota. Por eso siempre estoy en los espacios de la comunidad de Tesla. Y tengo la mejor lista de Tesla aquí en X. Las listas están a punto de volverse mucho más importantes. Piénsalas como la verdad fundamental. Lo ves todo. Te mantiene conectado a la realidad. @GaryShapiro se detuvo amablemente y habló conmigo durante unos momentos preciosos en el pasillo. Él dirige el espectáculo y siempre ha sido un hombre amable. No puedo imaginar un mejor líder para la industria tecnológica. Y su espectáculo dio inicio a la era autónoma. Mercedes me dio su primer viaje en su primer vehículo de IA aquí hace años. Gary merece crédito por apoyar los vehículos autónomos desde el principio. Pero Brad me ha hecho reflexionar sobre la diferencia entre la intuición y el conocimiento. Reevaluando todo en la categoría del conocimiento porque se encontraron errores en mi pensamiento. Sé de avances que se avecinan. Pero debo admitir que no sé cuándo se activará el Robotaxi de Tesla sin humanos a bordo. Los datos resuelven todos los argumentos. Elon se verá obligado a desacelerar hasta que tenga suficientes datos. No puede permitirse ver que el sistema comete un error, me dijo Brad que por eso no lo ve enviándose pronto. Los abogados no dejarán que se envíe hasta que esté terminado. La verdad es que todos en el equipo se dan cuenta de que tiene que ser perfecto cuando se active. O muy, muy cercano.
480EB0
480EB09 ene, 08:38
Hoy, estamos acompañados por @rdn_nikita, cofundador y CEO de @FlexionRobotics para discutir la brecha entre las capacidades robóticas actuales y lo que se requiere para desplegar robots totalmente autónomos en el mundo real. Nikita explica cómo el aprendizaje por refuerzo y la simulación han impulsado un progreso rápido en la locomoción robótica—y por qué la locomoción aún está lejos de estar "resuelta". Profundizamos en la brecha sim2real, y cómo agregar entradas visuales introduce ruido y complica significativamente la transferencia de sim a real. También exploramos el debate entre modelos de extremo a extremo y enfoques modulares, y por qué separar locomoción, planificación y semántica sigue siendo un enfoque pragmático hoy en día. Nikita también introduce el concepto de "real-a-sim", que utiliza datos del mundo real para refinar los parámetros de simulación para un entrenamiento de mayor fidelidad, discute cómo se combinan el aprendizaje por refuerzo, el aprendizaje por imitación y los datos de teleoperación para entrenar políticas robustas tanto para robots cuadrúpedos como humanoides, y presenta el enfoque jerárquico de Flexion que utiliza Modelos de Lenguaje-Visión (VLMs) preentrenados para la orquestación de tareas de alto nivel con modelos de Lenguaje-Visión-Acción (VLA) y rastreadores de cuerpo completo de bajo nivel. Finalmente, Nikita comparte lo que hay detrás de las demostraciones de robots humanoides, su opinión sobre el aprendizaje por refuerzo en simulación frente al mundo real, las sutilezas de la sintonización de recompensas, y ofrece consejos prácticos para investigadores y profesionales que buscan comenzar en robótica hoy. 🗒️ Para la lista completa de recursos de este episodio, visita la página de notas del programa: 📖 CAPÍTULOS =============================== 00:00 - Introducción 04:07 - ¿Está resuelta la locomoción robótica? 06:04 - Brecha sim-a-real 08:58 - Agregando semántica a las políticas 09:42 - Arquitecturas modulares vs de extremo a extremo 10:29 - Modelo de planificación 12:21 - Adaptando técnicas de RL de cuadrúpedos a humanoides 15:39 - Detrás de las demostraciones de robots 18:09 - Robots humanoides en entornos domésticos 22:03 - Enfoque de entrenamiento 23:56 - Modelos VLA 27:59 - Cerrando la brecha sim-a-real 32:55 - Orquestación de tareas usando VLMs 36:38 - Uso de herramientas 38:10 - Jerarquía de modelos 43:37 - Simulador versus entorno de simulación 44:57 - Combinando aprendizaje por imitación y aprendizaje por refuerzo 46:42 - RL en el mundo real versus RL en simulación 52:58 - Sintonización de recompensas y funciones de valor en robótica 56:38 - Predicciones 1:00:10 - Humanoides, cuadrúpedos y plataformas con ruedas 1:02:45 - Consejos, kits de robots recomendados y comunidad.
Conocí a Omar, que dirige Whole Mars Catalog, en el stand de @waymo.
La cuenta X de Brad es en realidad @bradtem, lo siento por eso, Brad. No me deja editar. Suspiro.
441