WOW "DLCM puede reducir los flops de inferencia en un 34% en comparación con la arquitectura de transformador denso estándar."