¡Presentamos el Informe Técnico de GLM-5! Después del lanzamiento de GLM-5, estamos desvelando cómo se construyó. Las innovaciones clave incluyen: - Adopción de DSA: Reduce significativamente los costos de entrenamiento e inferencia mientras preserva la fidelidad en contextos largos - Infraestructura de RL Asincrónica: Mejora drásticamente la eficiencia post-entrenamiento al desacoplar la generación del entrenamiento - Algoritmos de RL para Agentes: Permite que el modelo aprenda de interacciones complejas y de largo plazo de manera más efectiva A través de estas innovaciones, GLM-5 logra un rendimiento SOTA entre los modelos de código abierto, con resultados particularmente sólidos en tareas de ingeniería de software del mundo real.