Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
Director de Robótica y Científico Distinguido de NVIDIA. Co-Líder del laboratorio GEAR. Resolviendo AGI físico, un motor a la vez. Stanford Ph.D. 1er pasante de OpenAI.
Estoy observando una mini paradoja de Moravec dentro de la robótica: las acrobacias que son difíciles para los humanos son mucho más fáciles para los robots que las tareas "poco atractivas" como cocinar, limpiar y ensamblar. Esto genera una disonancia cognitiva para las personas ajenas al campo, "entonces, ¿los robots pueden hacer parkour y breakdance, pero por qué no pueden cuidar de mi perro?" Créeme, mis padres me han preguntado sobre esto más de lo que piensas...
La "paradoja de Moravec de los robots" también crea la ilusión de que las capacidades físicas de la IA están mucho más avanzadas de lo que realmente están. No estoy señalando a Unitree, ya que esto se aplica ampliamente a todas las recientes demostraciones acrobáticas en la industria. Aquí hay una prueba simple: si colocas una pared frente al robot que hace volteretas laterales, se estrellará contra ella a toda velocidad y hará un espectáculo. Porque simplemente está sobreajustando ese único movimiento de referencia, sin ninguna conciencia del entorno.
Aquí está la razón por la que existe la paradoja: es mucho más fácil entrenar a un "gimnasta ciego" que a un robot que ve y manipula. El primero se puede resolver completamente en simulación y transferir sin problemas al mundo real, mientras que el segundo exige un renderizado extremadamente realista, física de contacto y dinámicas de objetos desordenadas en el mundo real, ninguna de las cuales se puede simular bien.
Imagina que puedes entrenar LLMs no desde internet, sino desde un juego de consola de texto hecho a mano. Los robóticos tuvieron suerte. Afortunadamente, vivimos en un mundo donde los motores de física acelerados son tan buenos que podemos salirnos con acrobacias impresionantes usando literalmente cero datos reales. Pero aún no hemos descubierto el mismo código de trampa para la destreza general.
Hasta entonces, seguiremos siendo cuestionados por nuestros padres confundidos.
318,96K
Mi criterio para la AGI es mucho más simple: una IA cocinando una buena cena en la casa de cualquiera para cualquier cocina. La Prueba de Turing Física es muy probablemente más difícil que el Premio Nobel. La paradoja de Moravec seguirá atormentándonos, acechando más grande y oscura, durante la próxima década.

Thomas Wolf19 jul, 16:06
Mi criterio para la AGI es que una IA gane un Premio Nobel por una nueva teoría que haya originado.
99,02K
He estado un poco callado en X recientemente. El año pasado ha sido una experiencia transformadora. Grok-4 y Kimi K2 son increíbles, pero el mundo de la robótica es un maravilloso salvaje oeste. Se siente como el PLN en 2018 cuando se publicó GPT-1, junto con BERT y mil otras flores que florecieron. Nadie sabía cuál de ellas se convertiría eventualmente en ChatGPT. Los debates eran acalorados. La entropía estaba por las nubes. Las ideas eran increíblemente divertidas.
Creo que el GPT-1 de la robótica ya está en algún lugar de Arxiv, pero no sabemos exactamente cuál. Podría ser modelos del mundo, RL, aprendizaje a partir de videos humanos, sim2real, real2sim, etc., o cualquier combinación de ellos. Los debates son acalorados. La entropía está por las nubes. Las ideas son increíblemente divertidas, en lugar de exprimir los últimos pocos % en AIME y GPQA.
La naturaleza de la robótica también complica enormemente el espacio de diseño. A diferencia del mundo limpio de bits para LLMs (cadenas de texto), nosotros, los robóticos, tenemos que lidiar con el desordenado mundo de los átomos. Después de todo, hay un trozo de metal definido por software en el bucle. Los normies de LLM pueden encontrar difícil de creer, pero hasta ahora los robóticos aún no pueden ponerse de acuerdo sobre un estándar de referencia. Diferentes robots tienen diferentes capacidades - algunos son mejores en acrobacias mientras que otros en manipulación de objetos. Algunos están destinados para uso industrial mientras que otros son para tareas domésticas. El cruce de encarnaciones no es solo una novedad de investigación, sino una característica esencial para un cerebro robótico universal.
He hablado con docenas de líderes de C-suite de varias empresas de robots, tanto antiguas como nuevas. Algunos venden el cuerpo completo. Algunos venden partes del cuerpo como manos hábiles. Muchos más venden las palas para fabricar nuevos cuerpos, crear simulaciones o recopilar enormes cantidades de datos. El espacio de ideas de negocio es tan salvaje como la investigación misma. Es una nueva fiebre del oro, como la que no hemos visto desde la ola de ChatGPT de 2022.
El mejor momento para entrar es cuando los picos de no consenso. Aún estamos al inicio de una curva de pérdidas - hay fuertes signos de vida, pero muy, muy lejos de la convergencia. Cada paso de gradiente nos lleva a lo desconocido. Pero una cosa sé con certeza: no hay AGI sin tocar, sentir y estar encarnado en el desordenado mundo.
En una nota más personal: dirigir un laboratorio de investigación conlleva un nuevo nivel de responsabilidad. Dar actualizaciones directamente al CEO de una empresa de $4 billones es, para decirlo suavemente, tanto emocionante como absorbente de mi atención. Se acabaron los días en que podía estar al tanto y profundizar en cada noticia de IA.
Intentaré encontrar tiempo para compartir más de mi viaje.

876,93K
El Test Físico de Turing: tu casa es un completo desastre después de un hackathon dominical. El lunes por la noche, llegas a casa con una sala de estar inmaculada y una cena a la luz de las velas. Y no se podía saber si un humano o una máquina había estado allí. Engañosamente simple, increíblemente difícil.
Es la próxima estrella polar de la IA. El sueño que me mantiene despierto a las 12 de la mañana en el laboratorio. La visión de la próxima plataforma informática que automatice trozos de átomos en lugar de trozos de bits.
¡Gracias Sequoia por recibirme en AI Ascent! A continuación se muestra mi charla completa sobre los primeros principios para resolver la robótica de propósito general: cómo pensamos sobre la estrategia de datos y las leyes de escalado. ¡Te aseguro que serán 17 minutos de los que no te arrepentirás!
107,2K
Algún día en la próxima década, tendremos robots en cada hogar, en cada hospital y fábrica, haciendo todos los trabajos aburridos y peligrosos con una destreza sobrehumana. Ese día se conocerá como "Jueves". Ni siquiera Turing se atrevería a soñar nuestra vida en sus sueños más salvajes.

signüll21 abr 2025
Cruzamos el test de Turing y a nadie le importó una mierda. No hay desfiles. Sin titulares de portada. justo... Un encogimiento de hombros casual. Como: "Oh, sí, las máquinas son lo suficientemente inteligentes como para engañarnos ahora. De todos modos, ¿qué hay para almorzar?"
Ese silencio te dice todo sobre el ritmo al que nos movemos.
En mis clases de informática, el test de Turing era tratado como el jefe final. Ahora, cada avance es otro maldito martes.
101,94K
las olimpiadas humanoides en 2030 serán todo un espectáculo

Jim Fan5 feb 2025
¡Hemos RL'd robots humanoides a Cristiano Ronaldo, LeBron James y Kobe Bryant! Estas son redes neuronales que funcionan en hardware real en nuestro laboratorio GEAR. La mayoría de las demostraciones de robots que ves en línea aceleran los videos. Nosotros en realidad *los ralentizamos* para que puedas disfrutar de los movimientos fluidos.
Estoy emocionado de anunciar "ASAP", un modelo "real2sim2real" que domina movimientos extremadamente suaves y dinámicos para el control corporal completo de humanoides.
Preentrenamos al robot en simulación primero, pero hay una notoria brecha "sim2real": es muy difícil que las ecuaciones físicas diseñadas a mano coincidan con la dinámica del mundo real.
Nuestra solución es simple: solo despliega una política preentrenada en hardware real, recopila datos y reproduce el movimiento en simulación. La reproducción obviamente tendrá muchos errores, pero eso proporciona una señal rica para compensar la discrepancia física. Usa otra red neuronal para aprender el delta. Básicamente, "parcheamos" un motor físico tradicional, para que el robot pueda experimentar casi el mundo real a gran escala en GPUs.
El futuro es la simulación híbrida: combina el poder de los motores de simulación clásicos refinados a lo largo de décadas y la asombrosa capacidad de las redes neuronales modernas para capturar un mundo desordenado.
45,82K
¡Hemos RL'd robots humanoides a Cristiano Ronaldo, LeBron James y Kobe Bryant! Estas son redes neuronales que funcionan en hardware real en nuestro laboratorio GEAR. La mayoría de las demostraciones de robots que ves en línea aceleran los videos. Nosotros en realidad *los ralentizamos* para que puedas disfrutar de los movimientos fluidos.
Estoy emocionado de anunciar "ASAP", un modelo "real2sim2real" que domina movimientos extremadamente suaves y dinámicos para el control corporal completo de humanoides.
Preentrenamos al robot en simulación primero, pero hay una notoria brecha "sim2real": es muy difícil que las ecuaciones físicas diseñadas a mano coincidan con la dinámica del mundo real.
Nuestra solución es simple: solo despliega una política preentrenada en hardware real, recopila datos y reproduce el movimiento en simulación. La reproducción obviamente tendrá muchos errores, pero eso proporciona una señal rica para compensar la discrepancia física. Usa otra red neuronal para aprender el delta. Básicamente, "parcheamos" un motor físico tradicional, para que el robot pueda experimentar casi el mundo real a gran escala en GPUs.
El futuro es la simulación híbrida: combina el poder de los motores de simulación clásicos refinados a lo largo de décadas y la asombrosa capacidad de las redes neuronales modernas para capturar un mundo desordenado.
543,12K
Que un *segundo* documento haya salido con toneladas de secretos del ciclo de retroalimentación de RL y razonamiento *multimodal* al estilo o1 no estaba en mi tarjeta de bingo hoy. Los documentos de Kimi (otra startup) y DeepSeek convergieron notablemente en hallazgos similares:
> No es necesario un complejo árbol de búsqueda como MCTS. Simplemente linealiza la traza de pensamiento y haz una buena predicción autorregresiva;
> No es necesario funciones de valor que requieran otra costosa copia del modelo;
> No es necesario modelar recompensas densas. Confía tanto como sea posible en la verdad fundamental, el resultado final.
Diferencias:
> DeepSeek utiliza el enfoque de AlphaZero: se inicia puramente a través de RL sin entrada humana, es decir, "inicio en frío". Kimi utiliza el enfoque de AlphaGo-Master: un ligero SFT para calentar a través de trazas de CoT diseñadas por prompts.
> Los pesos de DeepSeek tienen licencia MIT (¡liderazgo de pensamiento!); Kimi aún no tiene un lanzamiento de modelo.
> Kimi muestra un fuerte rendimiento multimodal (!) en benchmarks como MathVista, que requiere comprensión visual de geometría, pruebas de CI, etc.
> El documento de Kimi tiene MUCHOS más detalles sobre el diseño del sistema: infraestructura de RL, clúster híbrido, sandbox de código, estrategias de paralelismo; y detalles de aprendizaje: contexto largo, compresión de CoT, currículo, estrategia de muestreo, generación de casos de prueba, etc.
¡Lecturas optimistas en un día festivo!

300,43K
Parte superior
Clasificación
Favoritos
En tendencia on-chain
En tendencia en X
Principales fondos recientes
Más destacado