A equipe GLM agora está usando MLA!! esse é um modelo bem insano, com 30B de parâmetro total e cerca de 4B ativos. Lançamento muito bom Em termos de estrutura, tem aproximadamente a mesma profundidade que o GLM4.5 Air e o Qwen3 30B A3B, 64 no total de Expert em vez de 128, mas eles só ativam 5 em vez de 9 se você contar o Expert compartilhado