WOW "DLCM kann die Inferenz-Flops im Vergleich zur standardmäßigen dichten Transformer-Architektur um 34 % reduzieren."