Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
Director de Robótica y Científico Distinguido de NVIDIA. Co-Líder del laboratorio GEAR. Resolviendo AGI físicos, un motor a la vez. Stanford Ph.D. 1er pasante de OpenAI.
Estoy observando una mini paradoja de Moravec dentro de la robótica: la gimnasia que es difícil para los humanos es mucho más fácil para los robots que las tareas "poco atractivas" como cocinar, limpiar y ensamblar. Conduce a una disonancia cognitiva para las personas fuera del campo, "entonces, los robots pueden hacer parkour y breakdance, pero ¿por qué no pueden cuidar a mi perro?" Créeme, mis padres me preguntaron sobre esto más de lo que piensas ...
La "paradoja del robot Moravec" también crea la ilusión de que las capacidades físicas de la IA son mucho más avanzadas de lo que realmente son. No estoy señalando a Unitree, ya que se aplica ampliamente a todas las demostraciones acrobáticas recientes en la industria. Aquí hay una prueba simple: si coloca una pared frente al robot que se voltea lateralmente, se estrellará contra ella con toda su fuerza y hará un espectáculo. Porque solo está sobreajustando ese movimiento de referencia única, sin ninguna conciencia del entorno.
He aquí por qué existe la paradoja: es mucho más fácil entrenar a un "gimnasta ciego" que a un robot que ve y manipula. El primero se puede resolver completamente en simulación y transferir de cero disparos al mundo real, mientras que el segundo exige una representación extremadamente realista, física de contacto y dinámica de objetos del mundo real desordenada, ninguno de los cuales se puede simular bien.
Imagina que puedes entrenar LLM no desde Internet, sino desde un juego de consola de texto puramente hecho a mano. Los roboticistas tuvieron suerte. Resulta que vivimos en un mundo donde los motores de física acelerada son tan buenos que podemos salirnos con la nuestra con acrobacias impresionantes usando literalmente cero datos reales. Pero aún no hemos descubierto el mismo código de trucos para la destreza general.
Hasta entonces, nuestros padres confundidos seguirán cuestionándonos.
279.41K
Mi barra para AGI es mucho más simple: una IA cocinando una buena cena en la casa de cualquier persona para cualquier cocina. La prueba de Turing física es muy probablemente más difícil que el Premio Nobel. La paradoja de Moravec seguirá persiguiéndonos, haciéndose más grande y más oscura, durante la próxima década.

Thomas Wolf19 jul, 16:06
Mi barra para AGI es una IA que gana un Premio Nobel por una nueva teoría que originó.
98.99K
He estado un poco callado en X recientemente. El último año ha sido una experiencia transformadora. Grok-4 y Kimi K2 son increíbles, pero el mundo de la robótica es un maravilloso salvaje oeste. Se siente como PNL en 2018 cuando se publicó GPT-1, junto con BERT y mil otras flores que florecieron. Nadie sabía cuál se convertiría finalmente en ChatGPT. Los debates fueron acalorados. La entropía estaba por las nubes. Las ideas eran increíblemente divertidas.
Creo que el GPT-1 de la robótica ya está en algún lugar de Arxiv, pero no sabemos exactamente cuál. Podrían ser modelos de mundos, RL, aprendiendo de video humano, sim2real, real2sim, etc. etc, o cualquier combinación de ellos. Los debates son acalorados. La entropía está por las nubes. Las ideas son increíblemente divertidas, en lugar de exprimir el último porcentaje en AIME y GPQA.
La naturaleza de la robótica también complica enormemente el espacio de diseño. A diferencia del mundo limpio de los bits para los LLM (cadenas de texto), los expertos en robótica tenemos que lidiar con el desordenado mundo de los átomos. Después de todo, hay un trozo de metal definido por software en el bucle. Puede que a los normies de LLM les cueste creerlo, pero hasta ahora los robotistas siguen sin ponerse de acuerdo en un punto de referencia. Los diferentes robots tienen diferentes envolventes de capacidad: algunos son mejores en acrobacias mientras que otros en la manipulación de objetos. Algunos están destinados para uso industrial, mientras que otros son para tareas domésticas. La encarnación cruzada no es solo una novedad en la investigación, sino una característica esencial para un cerebro robótico universal.
He hablado con docenas de líderes de alto nivel de varias compañías de robots, antiguas y nuevas. Algunos venden todo el cuerpo. Algunos venden partes del cuerpo, como manos diestras. Muchos otros venden las palas para fabricar nuevos cuerpos, crear simulaciones o recopilar grandes cantidades de datos. El espacio de las ideas de negocio es tan salvaje como la propia investigación. Es una nueva fiebre del oro, como no hemos visto desde la ola de ChatGPT de 2022.
El mejor momento para entrar es cuando la falta de consenso alcanza su punto máximo. Todavía estamos en el comienzo de una curva de pérdidas: hay fuertes señales de vida, pero muy, muy lejos de la convergencia. Cada paso de gradiente nos lleva a lo desconocido. Pero una cosa sí sé con certeza: no hay AGI sin tocar, sentir y ser encarnado en el mundo desordenado.
En una nota más personal, dirigir un laboratorio de investigación conlleva un nuevo nivel de responsabilidad. Dar actualizaciones directamente al CEO de una empresa de 4 billones de dólares es, por decirlo suavemente, emocionante y absorbente para mis pesos de atención. Atrás quedaron los días en los que podía estar al tanto y profundizar en todas las noticias de IA.
Trataré de sacar tiempo para compartir más de mi viaje.

876.9K
El Test Físico de Turing: tu casa es un completo desastre después de un hackathon dominical. El lunes por la noche, llegas a casa con una sala de estar inmaculada y una cena a la luz de las velas. Y no se podía saber si un humano o una máquina había estado allí. Engañosamente simple, increíblemente difícil.
Es la próxima estrella polar de la IA. El sueño que me mantiene despierto a las 12 de la mañana en el laboratorio. La visión de la próxima plataforma informática que automatice trozos de átomos en lugar de trozos de bits.
¡Gracias Sequoia por recibirme en AI Ascent! A continuación se muestra mi charla completa sobre los primeros principios para resolver la robótica de propósito general: cómo pensamos sobre la estrategia de datos y las leyes de escalado. ¡Te aseguro que serán 17 minutos de los que no te arrepentirás!
107.17K
Algún día en la próxima década, tendremos robots en cada hogar, en cada hospital y fábrica, haciendo todos los trabajos aburridos y peligrosos con una destreza sobrehumana. Ese día se conocerá como "Jueves". Ni siquiera Turing se atrevería a soñar nuestra vida en sus sueños más salvajes.

signüll21 abr 2025
Cruzamos el test de Turing y a nadie le importó una mierda. No hay desfiles. Sin titulares de portada. justo... Un encogimiento de hombros casual. Como: "Oh, sí, las máquinas son lo suficientemente inteligentes como para engañarnos ahora. De todos modos, ¿qué hay para almorzar?"
Ese silencio te dice todo sobre el ritmo al que nos movemos.
En mis clases de informática, el test de Turing era tratado como el jefe final. Ahora, cada avance es otro maldito martes.
101.91K
Los Juegos Olímpicos de Humanoides en 2030 serán todo un espectáculo

Jim Fan5 feb 2025
¡Enviamos robots humanoides a Cristiano Ronaldo, LeBron James y Kobe Byrant! Se trata de redes neuronales que se ejecutan en hardware real en nuestro laboratorio GEAR. La mayoría de las demostraciones de robots que ves en línea aceleran los videos. De hecho, los *ralentizamos* para que pueda disfrutar de los movimientos fluidos.
Estoy emocionado de anunciar "ASAP", un modelo "real2sim2real" que domina movimientos extremadamente suaves y dinámicos para el control humanoide de todo el cuerpo.
Primero entrenamos previamente al robot en la simulación, pero hay una brecha notoria de "sim2real": es muy difícil que las ecuaciones físicas diseñadas a mano coincidan con la dinámica del mundo real.
Nuestra solución es simple: simplemente implemente una política preentrenada en hardware real, recopile datos y reproduzca el movimiento en la simulación. Obviamente, la repetición tendrá muchos errores, pero eso da una señal rica para compensar la discrepancia física. Utilice otra red neuronal para aprender el delta. Básicamente, "parcheamos" un motor de física tradicional, para que el robot pueda experimentar casi el mundo real a escala en las GPU.
El futuro es la simulación híbrida: combina la potencia de los motores de simulación clásicos refinados durante décadas y la asombrosa capacidad de las NN modernas para capturar un mundo desordenado.
45.79K
¡Enviamos robots humanoides a Cristiano Ronaldo, LeBron James y Kobe Byrant! Se trata de redes neuronales que se ejecutan en hardware real en nuestro laboratorio GEAR. La mayoría de las demostraciones de robots que ves en línea aceleran los videos. De hecho, los *ralentizamos* para que pueda disfrutar de los movimientos fluidos.
Estoy emocionado de anunciar "ASAP", un modelo "real2sim2real" que domina movimientos extremadamente suaves y dinámicos para el control humanoide de todo el cuerpo.
Primero entrenamos previamente al robot en la simulación, pero hay una brecha notoria de "sim2real": es muy difícil que las ecuaciones físicas diseñadas a mano coincidan con la dinámica del mundo real.
Nuestra solución es simple: simplemente implemente una política preentrenada en hardware real, recopile datos y reproduzca el movimiento en la simulación. Obviamente, la repetición tendrá muchos errores, pero eso da una señal rica para compensar la discrepancia física. Utilice otra red neuronal para aprender el delta. Básicamente, "parcheamos" un motor de física tradicional, para que el robot pueda experimentar casi el mundo real a escala en las GPU.
El futuro es la simulación híbrida: combina la potencia de los motores de simulación clásicos refinados durante décadas y la asombrosa capacidad de las NN modernas para capturar un mundo desordenado.
543.09K
Que un *segundo* papel caído con toneladas de secretos del volante de RL y razonamientos *multimodales* al estilo o1 no está en mi cartón de bingo hoy. Los artículos de Kimi (otra startup) y DeepSeek convergieron notablemente en hallazgos similares:
> No es necesario realizar una búsqueda compleja de árboles como MCTS. Simplemente linealice el rastro del pensamiento y haga la buena predicción autorregresiva;
> No hay necesidad de funciones de valor que requieran otra copia costosa del modelo;
> No es necesario un modelado denso de recompensas. Confíe tanto como sea posible en la verdad sobre el terreno, el resultado final.
Diferencias:
> DeepSeek hace el enfoque de AlphaZero: puramente arranque a través de RL sin intervención humana, es decir, "arranque en frío". Kimi hace el enfoque AlphaGo-Master: SFT ligero para calentar a través de trazas de CoT diseñadas rápidamente.
> pesos de DeepSeek son licencia MIT (¡liderazgo de pensamiento!); Kimi aún no tiene un lanzamiento de modelo.
> Kimi muestra un fuerte rendimiento multimodal (!) en puntos de referencia como MathVista, que requiere comprensión visual de la geometría, pruebas de coeficiente intelectual, etc.
> documento de Kimi tiene MUCHOS más detalles sobre el diseño del sistema: infraestructura RL, clúster híbrido, sandbox de código, estrategias de paralelismo; y detalles de aprendizaje: contexto largo, compresión de CoT, currículo, estrategia de muestreo, generación de casos de prueba, etc.
¡Lecturas optimistas en un día festivo!

300.4K
Populares
Ranking
Favoritas
Onchain en tendencia
Tendencia en X
Principales fondos recientes
Más destacadas