Dla osób, które nie są projektantami cyfrowymi, pomyślcie o tym w ten sposób. 1. Regularny wzór ruchu danych TPU jest wydajny tylko dla mnożenia macierzy, bardziej sekwencyjny z natury. 2. Nvidia może realizować wszelkiego rodzaju wzory ruchu danych i koncentruje wiele zasobów sprzętowych na przepustowości i operacjach przestawiania, aby to osiągnąć. GPU to znacznie, znacznie, znacznie bardziej złożona architektura, a fakt, że można na nim wykonywać dość ogólne obliczenia w prostym języku, takim jak C++, jest w rzeczywistości dowodem na to, jak genialni są inżynierowie kompilatorów Nvidii.