Tim GLM sekarang menggunakan MLA!! ini adalah model yang cukup gila dengan total parameter 30B dan sekitar 4B aktif. rilis yang sangat bagus dalam hal strukturnya kira-kira kedalaman yang sama dengan glm4.5 air dan qwen3 30B A3B, 64 total expert, bukan 128, tetapi mereka hanya aktif 5, bukan 9 jika Anda menghitung ahli bersama