Apresentando o Relatório Técnico do GLM-5! Após o lançamento do GLM-5, estamos levantando o véu sobre como ele foi construído. As principais inovações incluem: - Adoção de DSA: Reduz significativamente os custos de treinamento e inferência, preservando a fidelidade de longo contexto - Infraestrutura de RL Assíncrona: Melhora drasticamente a eficiência pós-treinamento ao desacoplar a geração do treinamento - Algoritmos de RL de Agente: Permite que o modelo aprenda de interações complexas e de longo prazo de forma mais eficaz Através dessas inovações, o GLM-5 alcança desempenho SOTA entre modelos de código aberto, com resultados particularmente fortes em tarefas de engenharia de software do mundo real.