3 COSAS QUE IMPORTAN DEL TRATO $NVDA + GROQ 1. Esto iba de poseer la economía de la inferencia, no de arreglar una brecha de chip Nvidia no contrató Groq por compra porque estaba atrasado en chips, ya que Nvidia ya domina la formación y la mayoría de las inferencias, y su hoja de ruta (GB300, Rubin) sigue bajando el coste por token mientras expande el rendimiento más rápido que casi cualquier otro. El entrenamiento es un evento puntual, mientras que la inferencia es donde reside el nuevo modelo de negocio de IA, así que a medida que la IA avanza hacia productos reales, el dinero pasa a quien controla el runtime. 2. El futuro donde se escapa la inferencia Nvidia acaba de ser absorbido Groq fue una de las pocas pruebas creíbles de que la inferencia sensible a la latencia podría eventualmente abandonar las GPUs y, con el tiempo, eso habría minado poco a poco el estatus de "inevitable" de Nvidia. El riesgo se amplificó gracias al fundador de Groq, Jonathan Ross, quien anteriormente fabricaba TPUs en $GOOGL y ya demostró que el silicio personalizado puede competir en cargas de trabajo reales. Este acuerdo cierra esa puerta antes de que pueda escalar. 3. La inferencia determinista era la capa que faltaba Las GPU destacan por su flexibilidad y escala, pero nunca fueron diseñadas para garantizar tiempos de respuesta perfectamente consistentes. Eso importa porque la IA real falla cuando la latencia se desacelera: los asistentes de voz se pausan, la traducción en vivo se retrasa, los flujos de trabajo agentes acumulan los retrasos. Groq solucionó esto diseñando alrededor de grandes cantidades de SRAM, manteniendo los datos cerca del procesador y ofreciendo respuestas rápidas cada vez. Eso hizo que Groq fuera especialmente adecuado para IA en tiempo real, donde la latencia importa más que el rendimiento máximo. A estas alturas, es difícil argumentar que Nvidia solo vende chips cuando claramente está construyendo la plataforma que controla la formación, la red y ahora la inferencia en tiempo real. 20.000 millones hoy para evitar un problema de 200.000 millones después.