Actualización de mi vida: He decidido dejar a 1X. Ha sido un honor ayudar a hacer crecer la empresa. Me incorporé a Halodi Robotics en 2022 (nombre anterior de la empresa) como el único empleado con base en California. En ese momento, éramos unos 40 en Noruega y 2 en Texas. Mi primera contratación y yo trabajamos en mi garaje durante unos meses para ahorrar dinero. Hoy en día, 1X son cientos de personas, con hardware, diseño, software, IA, fabricación y producto, todo trasladado al área de la bahía de San Francisco, funcionando a pleno rendimiento y trabajando para preparar NEO para el hogar. Un gran agradecimiento a todos mis compañeros con los que trabajé. Fue una decisión difícil irse. Cuando trabajas en una startup emocionante que crece rápido, siempre hay mucho que hacer y nunca un momento perfecto para seguir adelante. Tenemos varios trabajos en desarrollo que son muy emocionantes porque avanzan enormemente en la autonomía general y la escalabilidad de nuestro enfoque de despliegue y realmente muestran un camino realista hacia el funcionamiento del producto. La reciente actualización de autonomía del Modelo Mundial es un ejemplo, y vienen más. La fábrica 1X es muy emocionante. Las cosas se están acelerando a una velocidad que me habría sorprendido hace unos años. En 2022, la mayoría de los tecnólogos, investigadores y capitalistas de riesgo eran escépticos respecto a los humanoides y el aprendizaje imitativo a gran escala. "¿Por qué piernas?" "¿Cómo podría ser suficiente el aprendizaje de principio a fin?" "¿Por qué ir por el hogar y no por la fábrica?" "¿Cómo vamos a recopilar suficientes datos?" La ventana Overton sobre la robótica de propósito general ha cambiado mucho desde entonces. Aunque aún estamos al principio de nuestra misión, sigo confiando en que pronto los robots domésticos serán tan comunes como los aires acondicionados, los coches y ChatGPT. Simplemente habla con el bot, y él irá y lo hará en silencio. Economías enteras acabarán reorganizándose en torno a esta tecnología. La gente lo entiende ahora. ¿Qué sigue? Creo que el progreso en el aprendizaje profundo aplicado generalmente depende de "aprovechar la magia" de algunos objetos mágicos. Estos objetos mágicos poseen mucho más poder de generalización del que uno podría esperar normalmente. Simplemente pedir al LLM que entienda lo que quieres es magia. Los modelos de generación de vídeo son mágicos. El razonamiento es magia. No te encuentras con un objeto mágico todos los días, pero cuando lo haces, te aseguras de cogerlo y ponerlo a trabajar para crear algo útil en el robot de alguna manera. Gran parte de mi convicción inicial sobre hacia dónde iba la robótica fue trabajando en BC-Z entre 2018 y 2021. El "objeto mágico" en el que aposté en ese momento eran las sorprendentes capacidades de absorción de datos del aprendizaje supervisado y de "pedir generalización". Esto fue pionero en muchos de los ingredientes estándar que vemos hoy en los VLA: - Generalización a comandos de lenguaje invisibles - DAgger guiado por humanos para la mejora de políticas - Predicciones auxiliares en lazo abierto + control del horizonte que retrocede, también conocido como fragmentación de acciones - Manipulación de puntos clave para mejorar el servoing - Simple ResNet18 con condicionamiento FiLM en entradas multimodales El siguiente "objeto mágico" por el que apostamos en 1X fueron los modelos de vídeo, porque claramente son objetos mágicos que aprenden una distribución de datos no muy diferente de lo que un robot necesita aprender. Generalizan sorprendentemente bien. Una vez más siento que ahora hay más objetos mágicos en juego, lo que abre muchas nuevas posibilidades para la robótica y más allá. Me estoy tomando unos meses para vaciar mi taza de antecedentes y ganar una nueva perspectiva. Cuando dejé Google en 2022, pasé unas dos semanas decidiendo qué hacer a continuación. Esta vez, quiero dedicar mucho más tiempo a ponerme al día con lo que ha pasado en el ámbito más amplio de la IA + robótica. He estado reimplementando algunos artículos sobre deep learning. Estoy trabajando en un gran tutorial para mi blog. Estoy aprendiendo todos los trucos de Claude para usuarios avanzados. Estoy leyendo las entradas del blog Thinking Machines para entender qué tipo de experimentos se están realizando en Frontier Labs. Estoy leyendo la tesis de Ben Katz de 2016 sobre el actuador Mini-guepardo. Viajaré a China en marzo para conocer a empresas increíbles del ecosistema robótico chino. Ahora, más que nunca, es el momento de que tanto humanos como máquinas aprendan. El siguiente símbolo de mi secuencia vital será importante. A los colegas e inversores que apostaron por 1X temprano, incluso antes de que nos convirtiéramos en un nombre conocido, os doy las gracias de todo corazón. No lo♥️ olvidaré