Ahora que he estado usando Sonnet 4.5 con Claude Code todo el día en varios proyectos (tanto backend como front-end), tengo algunas ideas.
En general, estoy muy impresionado hasta ahora y me encanta la cantidad de uso que puedo obtener ahora en comparación con el uso de Opus 4.1. Más allá de eso...
Hombre, el día del nuevo modelo es tan estimulante y divertido. Me siento como un niño en una tienda de dulces con 15+ instancias diferentes de Sonnet 4.5 Claude Code corriendo en mi máquina a la vez en 6 repositorios diferentes, todos estudiando, planificando, arreglando, mejorando, puliendo y armonizando mis proyectos.
Las limitaciones de energía resultarán ser temporales. Tenemos mucho gas natural en los EE. UU. y la tecnología de fabricación de turbinas no es un gran secreto como la fabricación de máquinas EUV de ASML. Los mercados son muy buenos para resolver este tipo de problemas más rápido de lo que nadie espera. Afán de lucro.
El $NVDA largo es este:
Tiene un espacio finito para un rack, esto está limitado por las paredes de un DC, pero principalmente por la cantidad de energía disponible.
En esa huella, puede colocar sus propios chips, NVDA, potencialmente ASIC, pero el objetivo final es servir tokens que pueda vender + un diferencial.
En ese TCO está el coste del rack + potencia (que al comparar entre racks, es fijo).
Entonces, la pregunta es cuánto está pagando por el estante y cuántas fichas puede escupir durante su vida útil. NVL72 puede hacer 1.5m token/s, @ 0.40c /millón en tokens de salida. Incluso si eso se comprime en un 70% cada año, ese rack generará casi $ 26 millones en ingresos en 3 años - $ 4 millones para el rack, = $ 22 millones
Lo que Jensen está diciendo es que si regalas los racks, las cajas no tienen el rendimiento suficiente para generar $ 22 millones en revoluciones de inferencia. Si tuviera una huella ilimitada, tal vez podría compensar el peor rendimiento, juntando más (que es lo que está haciendo China), y terminar con más ingresos.
Suponiendo 1) que cada rack está agotado por la demanda de tokens 2) estamos limitados por la energía 3) el precio no puede flexionarse hacia abajo a un nivel que compense el peor rendimiento, NVDA es largo.