Pro lidi, kteří nejsou digitální designéři, si to představte takto. 1. Běžný vzor pohybu dat TPU, efektivní pouze pro násobení matic, více sériového charakteru. 2. Nvidia dokáže provádět různé vzory přesunu dat a zaměřuje hodně hardwarových zdrojů na propustnost a přeskupení operací, aby toho dosáhla. GPU je mnohem, mnohem složitější architektura a fakt, že na něm lze dělat poměrně obecné výpočty v prostém jazyce jako C++, je vlastně důkazem toho, jak moc jsou inženýři kompilátorů Nvidie neschopní.