Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Under CES-konferansen har NVIDIAs nylig lanserte Rubin-arkitektur blitt fokus for nylige markedsdiskusjoner, hva som er et annet stort gjennombrudd i tillegg til MOE-arkitekturen, hva som er tilpasset Agentic AI-æraen, osv., jeg tok en nærmere titt, og jeg kjente lukten av Lao Huangs «selvrevolusjon»:
1) Tidligere stolte Nvidia på fordeler med GPU-maskinvare, og benyttet seg av utbytteperioden da store AI-giganter febrilsk kjøpte datakraft for å trene store modeller. På den tiden var logikken veldig enkel: den som hadde flest grafikkort kunne trene den beste modellen.
Men nå har AI-krigføring gått fra «regnekraft»-slagmarken til «inferens», spesielt etter Agentic-æraens ankomst, og AI må håndtere høyfrekvent, flertrinns og ultralang kontekstuell resonnement.
På dette tidspunktet er modellparametrene billioner, datagjennomstrømningen er ekstremt stor, uansett hvor raskt GPU-en er, hvis minnedataene ikke er raske nok, må GPU-en stå i hvilemodus, som er "lagringsveggen", med andre ord kan ikke grafikkortet lenger løse problemet, og det trenger fortsatt høy videominne- og båndbreddekapasitet for å støtte det. Det var det Rubin prøvde å løse.
2) Derfor kan Rubins første HBM4 støtte fjerde generasjon høybåndbreddeminne, noe som kan få båndbredden til å nå 22 TB/s. Men viktigere er det at den samarbeider med NVLink 6-teknologien (260TB/s båndbredde i racket), som logisk sett gjør 72 kort om til «en gigantisk brikke».
Hva betyr dette? Tidligere, når du kjøpte et grafikkort, kjøpte du uavhengige komponenter, og dataoverføringen mellom kortene var som en kurer som passerte gjennom flere overføringsstasjoner. Nå bruker Rubin ekstremt tette sammenkoblinger for å få data til å flyte mellom GPU-er med nesten ingen fysisk avstand, og 72 arbeidere jobber ikke lenger separat, men deler en hjerne.
Jeg tror dette er Rubins virkelige killer-trekk: ikke bare å stable maskinvareparametere, men å refaktorere dataflyten i hele systemet.
3) Hvis MOE (Hybrid Expert Model Architecture) er et dimensjonsreduksjonsslag mot Nvidias forretningsmodell for «voldelige stablekort» fra stigende stjerner som DeepSeek, så er Rubin et strategisk motangrep fra Lao Huang uansett hvordan man ser på det. Selvfølgelig betyr dette trikset også at Nvidia må si farvel til den gamle modellen med voldelig kortstabling.
Lao Huang beregner en annen konto: Hvis Agentic-æraen virkelig lander i tusenvis av industrier, må den krysse terskelen med token-kostnad, som er den generelle trenden Nvidia ikke kan opprettholde.
I Lao Huangs øyne, i stedet for å vente på at Google, Meta og andre store produsenter skal trenge inn på markedet, eller bli undergravd av DeepSeek og andre modeller, er det bedre å ta initiativet og være den som ødelegger spillet.
4) Spørsmålet er, hvordan vil Nvidia håndtere seg selv etter selvrevolusjonen? Veien er også veldig klar, fra å «selge grafikkort» til å «selge systemer», fra å betjene noen få store produsenter til å gjøre AI virkelig populær.
Tidligere, når du kjøpte H100, tjente Nvidia penger på grafikkortet, og Rubin vil fortelle deg i fremtiden: du må kjøpe et komplett sett med NVL72-rack – 72 GPU-er, NVLink-bryter, fullt væskekjølingssystem, skap og til og med støttende programvarestabler, alt pakket og solgt til deg.
Lao Huangs abakus er også veldig tydelig, det virker som om kostnaden for pakket maskinvare er dyrere, men med tillegg av ekstrem resonnementeffektivitet trekkes enhetskostnaden for kjøperens AI ned, og den vil naturlig nok ikke miste markedsandel.
Men terskelen for små og mellomstore spillere er også høyere. Kun store produsenter og skyleverandører har råd til å delta, noe som ytterligere vil forsterke monopolet på datakraft. I dagens konkurransesituasjon kan det kalles et stort veddemål, fordi når det oppstår problemer med masseproduksjonen av HBM4, vil det bli erstattet av alternativer lansert av AMD, Google TPU og andre alternativer som utnytter vindusperioden, og Nvidias drøm om å selge systemet kan være mindre lett å realisere.
Topp
Rangering
Favoritter
