🚀 Presentamos X-VLA; el nuevo modelo de Visión-Lenguaje-Acción de LeRobot, con indicaciones suaves. X-VLA está diseñado para escalar a través de muchas encarnaciones: diferentes robots, cámaras, espacios de acción y entornos, todo manejado por un único backbone de transformador unificado. - Generalista entre robots (Franka, WidowX, Agibot, simulación + real) - Los IDs de dominio de indicaciones suaves permiten que el modelo se adapte a nuevo hardware con pequeñas incrustaciones aprendibles - Coincidencia de flujo + núcleo de transformador para un control suave y continuo a 50 Hz - Preentrenado en un conjunto de datos de encarnaciones mixtas que abarca más de 7 plataformas y diversas tareas - Ajuste fino en cualquier conjunto de datos utilizando uno de los 6 puntos de control que proporcionamos listos para usar.