WOW "DLCM může snížit inferenční flopy o 34 % ve srovnání se standardní architekturou hustých transformátorů."