Per le persone che non sono designer digitali, pensateci in questo modo. 1. Il modello di movimento dati regolare del TPU è efficiente solo per la moltiplicazione di matrici, più seriale per natura. 2. Nvidia può gestire tutti i tipi di modelli di movimento dati e concentra molte risorse hardware sul throughput e sulle operazioni di riordino per ottenerlo. La GPU è un'architettura molto, molto, mooooolto più complessa e il fatto che si possa fare calcolo di uso generale in un linguaggio semplice come C++ su di essa è in realtà una testimonianza di quanto siano bravi gli ingegneri del compilatore di Nvidia.