Più approfondisco questa tendenza del rapporto CPU/GPU, più sono convinto (mi convinco) che in un data center dedicato esclusivamente all'inferenza, le CPU supereranno il numero di GPU/XPUs. Questo non era nemmeno una considerazione un anno fa, ma l'evoluzione dei modelli con agenti suggerisce questa direzione.