Die Skalierung der Inferenz betrifft die Architektur, nicht nur die Beschleunigung. Die AMD Instinct MI350X GPUs, die auf CDNA 4 basieren, ermöglichen eine höhere Token-Durchsatzrate und geringere Latenz in der Agentic Inference Cloud von @digitalocean. Leistung und Effizienz, entwickelt für produktive KI.