Команда GLM теперь использует MLA!! Это довольно безумная модель с 30B параметров и около 4B активных. Очень хорошее обновление По структуре она примерно такой же глубины, как glm4.5 air и qwen3 30B A3B, 64 эксперта вместо 128, но они активируют только 5 вместо 9, если считать общий эксперт.