WOW "DLCM peut réduire les flops d'inférence de 34 % par rapport à l'architecture de transformateur dense standard."