Apresentando o Relatório Técnico do GLM-5! Após o lançamento do GLM-5, vamos revelar como ele foi construído. Principais inovações incluem: - Adoção da DSA: Reduz significativamente os custos de treinamento e inferência, preservando a fidelidade de contexto longo - Infraestrutura RL Assíncrona: Melhora drasticamente a eficiência pós-treinamento ao desacoplar a geração do treinamento - Algoritmos RL de Agentes: Permitem que o modelo aprenda de forma mais eficaz a partir de interações complexas e de longo horizonte Por meio dessas inovações, o GLM-5 alcança desempenho SOTA entre modelos open-source, com resultados particularmente fortes em tarefas reais de engenharia de software.