Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
Director de Robótica y Científico Distinguido de NVIDIA. Co-Líder del laboratorio GEAR. Resolviendo AGI físicos, un motor a la vez. Stanford Ph.D. 1er pasante de OpenAI.
Había algo profundamente satisfactorio en ImageNet. Tenía un conjunto de entrenamiento bien seleccionado. Un protocolo de prueba claramente definido. Una competencia que reunió a los mejores investigadores. Y una tabla de clasificación que generó ResNets y ViTs, y finalmente cambió el campo para siempre.
Luego siguió la PNL. No importa cuánto estén en desacuerdo OpenAI, Anthropic y xAI, al menos están de acuerdo en una cosa: la evaluación comparativa. MMLU, HLE, SWEBench: no puede progresar hasta que pueda medirlo.
La robótica todavía no tiene tal llamada de atención. Nadie está de acuerdo en nada: hardware, tarea, puntuación, motor de simulación o entorno del mundo real. Todo el mundo es SOTA, por definición, en el punto de referencia que definen sobre la marcha para cada artículo.
Del creador de ImageNet: BEHAVIOR intenta el abrumador desafío de unificar la evaluación comparativa de la robótica en un motor de física reproducible (Isaac Sim). El proyecto comenzó antes de que me graduara de Stanford Vision Lab, y me tomó muchos años de dedicación y carreras de doctorado construirlo. Espero que BEHAVIOR sea la señal de escalada que necesitamos, o la chispa que finalmente nos haga hablar sobre cómo medir el progreso real como campo.

Fei-Fei Li3 sept, 04:10
(1/N) How close are we to enabling robots to solve the long-horizon, complex tasks that matter in everyday life?
🚨 We are thrilled to invite you to join the 1st BEHAVIOR Challenge @NeurIPS 2025, submission deadline: 11/15.
🏆 Prizes:
🥇 $1,000
🥈 $500
🥉 $300
504
Vibe Minecraft: un modelo de mundo multijugador, autoconsistente y en tiempo real que permite construir cualquier cosa y conjurar cualquier objeto. La función de las herramientas e incluso la propia mecánica del juego se puede programar mediante lenguaje natural, como "chrono-pickaxe: revertir cualquier bloque a un estado anterior en el tiempo" y "las cascadas se convierten en un puente arcoíris cuando pasan los unicornios". Los jugadores definen y manipulan colectivamente un mundo compartido.
El simulador neuronal toma como entrada un indicador del sistema *multimodal*: reglas del juego, pngs de activos, un mapa global y huevos de pascua. Guarda periódicamente los estados del juego como una secuencia de vectores latentes que se pueden volver a cargar en contexto, opcionalmente con "textos de guía" intercalados para permitir una fácil edición. Cada jugador tiene su propio json de estadísticas explícito (salud, inventario, coordenadas 3D), así como "vectores de jugadores" implícitos que capturan el historial de interacciones de orden superior.
Los administradores de juegos pueden crear un multiverso de Minecraft porque los latentes son compatibles con diferentes servidores. Cada mundo puede cruzarse sin problemas con otro para generar nuevos mundos en segundos. Las personas pueden mezclar y combinar con sus amigos o con sus propios estados pasados. Pueden surgir "vectores raros" cuando algunos jugadores inevitablemente deambulen por el extraño e inexplorado espacio latente del modelo del mundo. Esas matrices flotantes se pueden negociar como NFT. Cuanto más salvajes pruebes, más probabilidades tendrás de extraer vectores raros.
Quien lance Vibe Minecraft primero pasará a la historia como alterando el curso de los juegos para siempre.

541
Me encantaría ver la Ley de Escalado de FSD, ya que es el único ciclo de datos físico a escala planetaria. ¿Cuál es el "umbral de capacidad emergente" para el tamaño del modelo/datos?

Elon Musk6 ago 2025
Tesla está entrenando un nuevo modelo FSD con ~10X parámetros y una gran mejora en la pérdida de compresión de video.
Probablemente listo para el lanzamiento público a finales del próximo mes si las pruebas van bien.
414
Populares
Ranking
Favoritas