Regionální rozdělení není metrika marnivosti. Ukazuje, kde jsou požadavky skutečně obsluhovány, nejen kde se uživatelé nacházejí. Když je inference distribuována, pracovní zátěže jsou směrovány na nejbližší dostupný výpočetní limit, nikoli nuceny přes jednu oblast nebo datové centrum. To má skutečné důsledky: > Nižší latence pro koncové uživatele > Méně mezikontinentálních chmelů > Snížená dopravní zácpa během výkyvů > Lepší spolehlivost, když regiony mají problémy Globálně rozptýlená stopa znamená, že síť nezávisí na žádné konkrétní geografii, aby fungovala. Požadavky pokračují i v změně podmínek. Takto v praxi vypadá "globální"... Ne mapa uživatelů, ale mapa provádění.