DeepSeek-R1 gibi Uzmanların Karması (MoE) modelleri, yalnızca verimli bir şekilde ölçeklenebilmeleri durumunda yeni yetenek düzeylerinin kilidini açar. Raf ölçeğinde aşırı donanım-yazılım ortak tasarımının devreye girdiği yer burasıdır. NVIDIA Blackwell ve NVIDIA Dynamo ile yapay zeka hizmet sağlayıcıları, kümeleri akıllı çıkarım sistemlerine dönüştürerek token başına maliyeti düşürürken ×10 performans ve gelir elde edebilir.
Şimdi, NVIDIA Dynamo'nun büyük bulut sağlayıcılarıyla entegre olmasıyla, aynı çığır açan performans @AWSCloud, @Azure, @GoogleCloud ve @OracleCloud dahil olmak üzere bulut müşterileri tarafından kullanılabilir. Daha fazla bilgi edinin:
281