Algunas reflexiones actuales sobre TPU y $GOOG Primero: Rechazar el benchmarking de parámetros inválidos No discutas sobre cuánto difieren los parámetros de la GPU y la TPU, lo cara que es la migración y quién es mejor. ¿Cuál es el sentido de esto? $GOOG no es una empresa de semiconductores para empezar, y el TPU no es una mercancía lista para venderse en todas partes. Empezaron a diseñar hace casi una década y están completamente para servir a su negocio. Ni siquiera tienen suficiente de esto, ¿cómo van a tener tiempo para vendértelo? Es como si Amazon hiciera logística, para su propio ritmo, no para vender camiones. De la misma manera, esto no puede usarse para que Dazi $nvda vender cartas, $goog no para vender cartas, ¿cómo comparar? No es razonable que uses este FUD Dazi. Segundo: El núcleo de Géminis son las "capacidades de industrialización" Todos están enrollando el modelo en sí, pero ignorando el punto más importante del aterrizaje comercial: coste y velocidad (Economía de Unidades). La experiencia de Gemini me dice que Google está aprovechando los beneficios nativos de los TPUs para llevar el coste de la inferencia de IA al precio mínimo, manteniendo la latencia extremadamente baja. Si la IA se convierte en una "infraestructura" en el futuro, "fácil de usar, barato y responde en tiempo real" es mucho más importante que "extremadamente inteligente pero poco receptivo" en el 95% de los escenarios de usuario (comprobar información, escribir correos electrónicos y hacer resúmenes). Por favor, ten en cuenta que lo anterior es una hipótesis sobre el futuro, la IA está indecisa y nadie sabe cómo debería ser su futuro. $GOOG Es como el Ford o el Toyota del año. Introdujeron líneas de montaje (clústeres TPU) y crearon una línea de producción ligera (JAX/refrigeración líquida) que integraba software y hardware, convirtiendo los coches en un artículo asequible para todos los hogares, en lugar de un artículo de lujo para los ricos al principio de su nacimiento. Finalmente: No he dicho que el $NVDA sea malo, ni que otros modelos no puedan. ...