Mempresentasikan Laporan Teknis GLM-5! Setelah peluncuran GLM-5, kami menarik kembali tirai tentang bagaimana pembuatannya. Inovasi utama meliputi: - Adopsi DSA: Secara signifikan mengurangi biaya pelatihan dan inferensi sekaligus mempertahankan kesetiaan konteks panjang - Infrastruktur RL Asinkron: Secara drastis meningkatkan efisiensi pasca-pelatihan dengan memisahkan generasi dari pelatihan - Algoritma RL Agen: Memungkinkan model untuk belajar dari interaksi jangka panjang yang kompleks dengan lebih efektif Melalui inovasi ini, GLM-5 mencapai kinerja SOTA di antara model sumber terbuka, dengan hasil yang sangat kuat dalam tugas rekayasa perangkat lunak dunia nyata.