Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Mempresentasikan Laporan Teknis GLM-5!
Setelah peluncuran GLM-5, kami menarik kembali tirai tentang bagaimana pembuatannya. Inovasi utama meliputi:
- Adopsi DSA: Secara signifikan mengurangi biaya pelatihan dan inferensi sekaligus mempertahankan kesetiaan konteks panjang
- Infrastruktur RL Asinkron: Secara drastis meningkatkan efisiensi pasca-pelatihan dengan memisahkan generasi dari pelatihan
- Algoritma RL Agen: Memungkinkan model untuk belajar dari interaksi jangka panjang yang kompleks dengan lebih efektif
Melalui inovasi ini, GLM-5 mencapai kinerja SOTA di antara model sumber terbuka, dengan hasil yang sangat kuat dalam tugas rekayasa perangkat lunak dunia nyata.

Teratas
Peringkat
Favorit
