Команда GLM тепер використовує MLA!! Це досить божевільна модель із 30B загальною кількістю параметрів і близько 4B активними. Дуже гарний реліз За структурою це приблизно така ж глибина, як у GLM4.5 Air і QWEN3 30B A3B, 64 загальних експертних замість 128, але активують лише 5 замість 9, якщо рахувати спільного експерта