Pour les personnes qui ne sont pas des designers numériques, pensez-y comme ceci. 1. Le modèle de mouvement de données régulier du TPU est efficace uniquement pour la multiplication de matrices, plus sériel par nature. 2. Nvidia peut effectuer toutes sortes de modèles de mouvement de données et concentre beaucoup de ressources matérielles sur le débit et les opérations de réordonnancement pour y parvenir. Le GPU est une architecture beaucoup, beaucoup, beaucoup plus complexe et le fait que vous puissiez faire du calcul à usage général dans un langage simple comme C++ est en fait un témoignage de la compétence des ingénieurs en compilateurs de Nvidia.