Defalcarea regională nu este o metrică de vanitate. Arată unde sunt efectiv servite cererile, nu doar unde se află utilizatorii. Când inferența este distribuită, sarcinile de lucru sunt direcționate către cel mai apropiat calcul disponibil, nu forțate printr-o singură regiune sau centru de date. Asta are implicații reale: > Latență mai mică pentru utilizatorii finali > Mai puține hamei peste continente > Reducerea aglomerației în timpul creșterilor > Fiabilitate mai bună atunci când regiunile întâmpină probleme O amprentă distribuită global înseamnă că rețeaua nu depinde de o singură geografie pentru a funcționa. Cereri continuă să curgă chiar și atunci când condițiile se schimbă. Așa arată "global" în practică... Nu o hartă a utilizatorilor, ci o hartă a execuției.