Vi presenterar GLM-5:s tekniska rapport! Efter uppskjutningen av GLM-5 drar vi undan ridån för hur den byggdes. Viktiga innovationer inkluderar: - DSA-införande: Minskar utbildnings- och inferenskostnader avsevärt samtidigt som långtidskontexttrogenhet bevaras - Asynkron RL-infrastruktur: Förbättrar drastiskt effektiviteten efter träning genom att koppla bort generering från träning - Agent RL-algoritmer: Gör det möjligt för modellen att lära sig från komplexa, långhorisontiga interaktioner mer effektivt Genom dessa innovationer uppnår GLM-5 SOTA-prestanda bland öppna källkodsmodeller, med särskilt starka resultat i verkliga mjukvaruutvecklingsuppgifter.