Đội ngũ GLM hiện đang sử dụng MLA!! Đây là một mô hình khá điên rồ với tổng số 30B tham số và khoảng 4B đang hoạt động. Một bản phát hành rất tuyệt vời Về cấu trúc, nó gần như có độ sâu tương tự như glm4.5 air và qwen3 30B A3B, 64 chuyên gia tổng cộng thay vì 128, nhưng họ chỉ kích hoạt 5 thay vì 9 nếu bạn tính cả chuyên gia chia sẻ.