Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
Director de Robótica y Científico Distinguido de NVIDIA. Co-Líder del laboratorio GEAR. Resolviendo AGI físico, un motor a la vez. Stanford Ph.D. 1er pasante de OpenAI.
Había algo profundamente satisfactorio en ImageNet. Tenía un conjunto de entrenamiento bien curado. Un protocolo de prueba claramente definido. Una competencia que reunió a los mejores investigadores. Y una tabla de clasificación que dio origen a ResNets y ViTs, y que, en última instancia, cambió el campo para siempre.
Luego siguió el NLP. No importa cuánto discrepen OpenAI, Anthropic y xAI, al menos están de acuerdo en una cosa: la evaluación. MMLU, HLE, SWEBench - no puedes avanzar hasta que seas capaz de medirlo.
La robótica aún no tiene tal llamado unificador. Nadie está de acuerdo en nada: hardware, tarea, puntuación, motor de simulación o entorno del mundo real. Todos son SOTA, por definición, en el benchmark que definen sobre la marcha para cada artículo.
Del creador de ImageNet - BEHAVIOR intenta abordar el desafiante reto de unificar la evaluación de la robótica en un motor de física reproducible (Isaac Sim). El proyecto comenzó antes de que me graduara del Stanford Vision Lab, y tomó tantos años de dedicación y carreras de doctorado para construirlo. Espero que BEHAVIOR sea ya sea la señal de escalada que necesitamos, o la chispa que finalmente nos haga hablar sobre cómo medir el verdadero progreso como campo.

Fei-Fei Li3 sept, 04:10
(1/N) How close are we to enabling robots to solve the long-horizon, complex tasks that matter in everyday life?
🚨 We are thrilled to invite you to join the 1st BEHAVIOR Challenge @NeurIPS 2025, submission deadline: 11/15.
🏆 Prizes:
🥇 $1,000
🥈 $500
🥉 $300
498
Vibe Minecraft: un modelo de mundo en tiempo real, auto-consistente y multijugador que permite construir cualquier cosa y conjurar cualquier objeto. La función de las herramientas e incluso la mecánica del juego pueden ser programadas mediante lenguaje natural, como "pico crono: revertir cualquier bloque a un estado anterior en el tiempo" y "las cascadas se convierten en un puente arcoíris cuando los unicornios pasan". Los jugadores definen y manipulan colectivamente un mundo compartido.
La simulación neural toma como entrada un aviso de sistema *multimodal*: reglas del juego, pngs de activos, un mapa global y huevos de pascua. Guarda periódicamente los estados del juego como una secuencia de vectores latentes que pueden ser cargados de nuevo en contexto, opcionalmente con "textos de guía" intercalados para permitir una fácil edición. Cada jugador tiene su propio json de estadísticas explícitas (salud, inventario, coordenada 3D) así como "vectores de jugador" implícitos que capturan la historia de interacción de orden superior.
Los administradores del juego pueden crear un multiverso de Minecraft porque los latentes son compatibles entre diferentes servidores. Cada mundo puede cruzarse sin problemas con otro para generar nuevos mundos en segundos. Las personas pueden mezclar y combinar con los estados pasados de sus amigos o los suyos propios. "Vectores raros" pueden surgir ya que algunos jugadores inevitablemente vagarán por el extraño y desconocido espacio latente del modelo de mundo. Esas matrices flotantes pueden ser comerciadas como NFTs. Cuantas más cosas extrañas intentes, más probable será que encuentres vectores raros.
Quien lance Vibe Minecraft primero pasará a la historia como el que alteró el curso de los videojuegos para siempre.

535
Me encantaría ver la Ley de Escalado de FSD, ya que es el único ciclo de datos físico a escala planetaria. ¿Cuál es el "umbral de capacidad emergente" para el tamaño del modelo/datos?

Elon Musk6 ago 2025
Tesla está entrenando un nuevo modelo FSD con ~10X parámetros y una gran mejora en la pérdida de compresión de video.
Probablemente esté listo para su lanzamiento público a finales del próximo mes si las pruebas van bien.
408
Parte superior
Clasificación
Favoritos