Die regionale Aufschlüsselung ist keine Eitelkeitsmetrik. Sie zeigt, wo Anfragen tatsächlich bedient werden, nicht nur, wo sich die Benutzer befinden. Wenn die Inferenz verteilt ist, werden Arbeitslasten an die nächstgelegene verfügbare Rechenleistung geleitet, nicht durch eine einzelne Region oder ein Rechenzentrum gezwungen. Das hat echte Auswirkungen: > Geringere Latenz für Endbenutzer > Weniger grenzüberschreitende Hops > Reduzierte Staus während Spitzenzeiten > Bessere Zuverlässigkeit, wenn Regionen Probleme haben Ein global verteiltes Netzwerk bedeutet, dass das Netzwerk nicht von einer einzigen Geografie abhängt, um zu funktionieren. Anfragen fließen weiterhin, auch wenn sich die Bedingungen ändern. So sieht „global“ in der Praxis aus... nicht eine Karte der Benutzer, sondern eine Karte der Ausführung.