Was ist der wahre Maßstab eines TPU-Superpods? Der wahre Maßstab eines Supercomputers wird nicht durch die Anzahl der Prozessoren definiert, die man in einen Raum passen kann; er wird durch die Anzahl der Prozessoren definiert, die effektiv als eine Einheit denken können. Diese Unterscheidung ist die treibende Kraft hinter Ironwood, unserer siebten Generation der Tensor Processing Unit (TPU), und der Architektur des TPU-Superpods. Auf dem Papier ist der Maßstab eines Ironwood-Superpods beeindruckend: Er skaliert auf bis zu 9.216 Chips in einem einzigen, miteinander verbundenen Bereich. Aber der wahre Maßstab liegt in dem Gewebe, das sie verbindet. In einem Ironwood-Superpod verwenden wir eine bahnbrechende Inter-Chip-Interconnect (ICI)-Netzwerktechnologie, die mit 9,6 Terabit pro Sekunde läuft. Dies ermöglicht es diesen 9.216 Chips, mit nahezu sofortiger Latenz zu kommunizieren und auf massive 1,77 Petabyte gemeinsam genutzter High Bandwidth Memory (HBM) zuzugreifen. Wie verbindet man also fast 10.000 Chips, ohne ein Kabelchaos zu schaffen? Die Antwort liegt im Optical Circuit Switch (OCS). ◾ Ironwood-Cluster bestehen aus Bausteinen, die "Würfel" genannt werden (jeweils 64 Chips). ◾ Um über einen einzelnen Würfel hinaus zu skalieren, werden mehrere Würfel über ein Optical Circuit Switch (OCS)-Netzwerk verbunden. Dies ist ein dynamisches, umkonfigurierbares optisches Netzwerk, das ganze Würfel verbindet und es dem System ermöglicht, von einem kleinen "Pod" (z. B. einem 256-Chip-Ironwood-Pod mit vier Würfeln) zu einem massiven "Superpod" (z. B. einem 9.216-Chip-System mit 144 Würfeln) zu skalieren. ◾ Diese OCS-basierte Topologie ist der Schlüssel zur Fehlertoleranz. Wenn ein Würfel oder eine Verbindung ausfällt, weist der OCS-Manager das OCS an, diese Einheit optisch zu umgehen und neue, vollständige optische Schaltkreise mit einem vorgesehenen Ersatz zu etablieren. → Hardware ist nur die halbe Miete. Der wahre Maßstab eines TPU-Superpods wird durch einen gemeinsam entwickelten Software-Stack für schnellere, effizientere Ergebnisse freigeschaltet. Dank tiefgreifender Integrationen über den gesamten Stack – von hardwareoptimierungen im Rechenzentrum bis hin zu offener Software und verwalteten Diensten – sind Ironwood-TPUs unsere leistungsstärksten und energieeffizientesten TPUs bis heute.