Los modelos de mezcla de expertos (MoE) como DeepSeek-R1 desbloquean nuevos niveles de capacidad, pero solo si pueden escalar de manera eficiente. Ahí es donde entra en juego el codiseño extremo de hardware y software a escala de rack. Con NVIDIA Blackwell y NVIDIA Dynamo, los proveedores de servicios de IA pueden transformar clústeres en sistemas de inferencia inteligentes, logrando un rendimiento e ingresos del 10× al tiempo que reducen el costo por token.
Ahora, con la integración de NVIDIA Dynamo con los principales proveedores de nube, ese mismo rendimiento innovador está disponible para los clientes de la nube, incluidos @AWSCloud, @Azure, @GoogleCloud y @OracleCloud. Aprende más:
206