UAU "O DLCM pode reduzir os flops de inferência em 34% em comparação com a arquitetura de transformador denso padrão."