La suddivisione regionale non è una metrica di vanità. Mostra dove le richieste vengono effettivamente servite, non solo dove si trovano gli utenti. Quando l'inferenza è distribuita, i carichi di lavoro vengono indirizzati al calcolo disponibile più vicino, non forzati attraverso una singola regione o un datacenter. Questo ha reali implicazioni: > Maggiore velocità per gli utenti finali > Meno salti tra continenti > Congestione ridotta durante i picchi > Maggiore affidabilità quando le regioni affrontano problemi Un'impronta globalmente distribuita significa che la rete non dipende da una singola geografia per funzionare. Le richieste continuano a fluire anche quando le condizioni cambiano. Questo è ciò che significa "globale" nella pratica... non una mappa degli utenti, ma una mappa dell'esecuzione.