Presentamos nuestro nuevo modelo de video de frontera, Runway Gen-4.5. Anteriormente conocido como Whisper Thunder (también conocido como) David. Gen-4.5 es de última generación y establece un nuevo estándar para la calidad de movimiento en la generación de video, la adherencia a los prompts y la fidelidad visual. Aprende más a continuación.
Runway Gen-4.5 representa avances significativos tanto en la eficiencia de los datos de pre-entrenamiento como en las técnicas de post-entrenamiento para modelos de video y sirve como nuestro nuevo modelo base para la modelación del mundo. Gen-4.5 obtuvo 1,247 puntos Elo en la tabla de clasificación de Análisis Artificial de Texto a Video, estableciendo un nuevo estándar y superando todos los demás modelos de video de IA en el mundo.
Hace dos años, presentamos Gen-1, el primer modelo de generación de video disponible públicamente. Esto permitió una forma completamente nueva de expresión creativa y creó una nueva categoría de producto. En los últimos dos años, hemos liderado la industria en hacer que los modelos de video sean más potentes y controlables, desde la mejora significativa de los modelos base hasta la habilitación de nuevos controles y capacidades de edición general. Hoy, presentamos Gen-4.5 — la culminación de un largo esfuerzo de investigación para avanzar en el preentrenamiento y postentrenamiento de modelos de video.
El modelo destaca en la comprensión y ejecución de instrucciones complejas y secuenciadas. Puedes especificar una coreografía de cámara detallada, composiciones de escena intrincadas, el momento preciso de los eventos y cambios atmosféricos sutiles, todo dentro de un solo aviso. Seguimos comprometidos a crear herramientas altamente controlables y flexibles que te ayuden a dar vida a tu visión exacta. Además de Texto a Video, llevaremos todos los modos de control existentes (Imagen a Video, Fotogramas Clave, Video a Video) y más a Gen-4.5.
Gen-4.5 logra un nivel sin precedentes de precisión física y visual. Los objetos se mueven con un peso y una inercia realistas. Las superficies se comportan como lo harían en el mundo real. Las leyes de la física pueden ser observadas o ignoradas, dependiendo de tu visión. A pesar del gran avance en capacidades, permanecen limitaciones, como fallos en el razonamiento causal y la permanencia de los objetos. Creemos que esos modos de fallo deben ser abordados para avanzar aún más en la modelización del mundo, y estamos trabajando activamente para resolverlos.
Gen-4.5 fue desarrollado completamente en GPUs de NVIDIA a lo largo de la investigación y desarrollo inicial, el preentrenamiento, el postentrenamiento y la inferencia. Colaboramos extensamente con NVIDIA para llevar los límites de lo que es posible en la optimización de modelos de difusión de video, desde la eficiencia del entrenamiento hasta la velocidad de inferencia. La inferencia del modelo se ejecuta en GPUs de las series NVIDIA Hopper y Blackwell, ofreciendo un rendimiento optimizado sin comprometer la calidad. Un enfoque pionero en la industria que permite a Gen-4.5 lograr capacidades sin precedentes.
Estamos implementando gradualmente el acceso a Runway Gen-4.5. Estará disponible para todos en los próximos días. Más información:
Gen-4.5 fue desarrollado completamente en GPUs de @nvidia a lo largo de la investigación y desarrollo inicial, el preentrenamiento, el postentrenamiento y la inferencia. Colaboramos extensamente con NVIDIA para llevar los límites de lo que es posible en la optimización de modelos de difusión de video, desde la eficiencia del entrenamiento hasta la velocidad de inferencia. La inferencia del modelo se ejecuta en GPUs de las series NVIDIA Hopper y Blackwell, ofreciendo un rendimiento optimizado sin comprometer la calidad. Un enfoque pionero en la industria que permite a Gen-4.5 lograr capacidades sin precedentes.
@nvidia Estamos implementando gradualmente el acceso a Runway Gen-4.5. Estará disponible para todos en los próximos días. Más información:
425,26K