Представляем Технический отчет GLM-5! После запуска GLM-5 мы приоткрываем завесу над тем, как он был создан. Ключевые инновации включают: - Принятие DSA: Значительно снижает затраты на обучение и вывод, сохраняя при этом точность длинного контекста - Инфраструктура асинхронного RL: Резко улучшает эффективность после обучения, отделяя генерацию от обучения - Алгоритмы агентного RL: Позволяют модели более эффективно учиться на сложных взаимодействиях с длинным горизонтом Благодаря этим инновациям GLM-5 достигает SOTA производительности среди моделей с открытым исходным кодом, особенно показывая сильные результаты в реальных задачах программной инженерии.