Nå som jeg har brukt Sonnet 4.5 med Claude Code hele dagen på tvers av forskjellige prosjekter (både backend og frontend), har jeg noen tanker.
Totalt sett er jeg veldig imponert så langt og elsker hvor mye bruk jeg kan få nå sammenlignet med å bruke Opus 4.1. Utover det ...
Mann, ny modelldag er så spennende og morsom. Jeg føler meg som et barn i en godteributikk med 15+ forskjellige Sonnet 4.5 Claude Code-forekomster som løper rundt på maskinen min samtidig på tvers av 6 forskjellige reposer, som alle studerer, planlegger, fikser, forbedrer, polerer og harmoniserer prosjektene mine.
Strømbegrensningene vil vise seg å være midlertidige. Vi har mye naturgass i USA, og turbinproduksjonsteknologi er ikke en stor hemmelighet som å lage ASMLs EUV-maskiner. Markedene er veldig flinke til å løse denne typen problemer raskere enn noen forventer. Profittmotiv.
Den $NVDA lange tonehøyden er denne:
Du har en begrenset plass til et stativ - dette er begrenset av veggene til en DC, men mest av hvor mye strøm som er tilgjengelig.
På det fotavtrykket kan du plassere dine egne sjetonger, NVDA, potensielt ASIC-er, men sluttmålet er å servere tokens som du kan selge + en spread.
I den TCO er det rackkostnaden + strøm (som når man sammenligner mellom stativer, er fast).
Så spørsmålet er hvor mye du betaler for stativet og hvor mange tokens det kan spytte ut i løpet av levetiden. NVL72 kan gjøre 1,5 millioner token/s, @ 0,40c/million i utgangstokener. Selv om det komprimeres med 70 % hvert år, vil det stativet generere nesten 26 millioner dollar i inntekter på 3 år - 4 millioner dollar for stativet, = 22 millioner dollar
Det Jensen sier er at hvis du gir bort stativene, er ikke boksene effektive nok til å generere 22 millioner dollar i inferensomdreininger. HVIS du hadde ubegrenset fotavtrykk, kunne du kanskje gjøre opp for den dårligste ytelsen ved å sette sammen mer (som er det Kina gjør), og ende opp med mer inntekter.
Forutsatt 1) at hvert rack er brukt opp av token-etterspørsel 2) vi er strømbegrenset 3) prisen kan ikke bøye seg ned til et nivå som kompenserer for den dårligere ytelsen - NVDA er lang.