CES-konferenssin aikana NVIDIA:n vastikään lanseerattu Rubin-arkkitehtuuri on ollut viimeaikaisten markkinakeskustelujen keskiössä, mikä on toinen merkittävä läpimurto MOE-arkkitehtuurin lisäksi, mikä on räätälöity Agentic AI -aikakaudelle jne., katsoin tarkemmin ja tunsin Lao Huangin "itsevallankumouksen" tuoksun: 1) Aiemmin Nvidia luotti GPU-laitteiston etuihin, astuen osinkojaksoon, jolloin suuret tekoälyjätit ostivat kiihkeästi laskentatehoa suurten mallien kouluttamiseen. Tuolloin logiikka oli hyvin yksinkertainen: se, jolla oli enemmän näytönohjaimia, pystyi kouluttamaan parhaan mallin. Mutta nyt tekoälysodankäynti on siirtynyt "laskentatehon" taistelukentältä "päättelyyn", erityisesti agenttien aikakauden myötä, tekoälyn täytyy käsitellä korkeataajuista, monivaiheista ja erittäin pitkää kontekstuaalista päättelyä. Tällä hetkellä mallin parametrit ovat biljoonia, tiedonsiirto on erittäin suuri, riippumatta siitä, kuinka nopea GPU on, jos muistidata ei ole tarpeeksi nopeaa, GPU:n täytyy olla käyttämättömänä, eli "tallennusseinä", toisin sanoen näytönohjain ei enää pysty ratkaisemaan ongelmaa, ja se tarvitsee edelleen suuren videomuistin ja kaistanleveyden tukeakseen. Sitä Rubin yritti ratkaista. 2) Näin ollen Rubinin ensimmäinen HBM4 tukee neljännen sukupolven suuren kaistanleveyden muistia, mikä voi nostaa kaistanleveyden 22TB/s:iin. Mutta vielä tärkeämpää on, että se tekee yhteistyötä NVLink 6 -teknologian kanssa (260TB/s kaistanleveys hyllyssä), joka loogisesti muuttaa 72 korttia "jättimäiseksi siruksi". Mitä tämä tarkoittaa? Aiemmin, kun ostit näytönohjaimen, ostit itsenäisiä komponentteja, ja korttien välinen tiedonsiirto oli kuin kuriiri, joka kulki useiden siirtoasemien läpi. Nyt Rubin käyttää erittäin tiheän tiheyden yhteyksiä saadakseen datan virtaamaan GPU:iden välillä lähes ilman fyysistä etäisyyttä, ja 72 työntekijää ei enää työskentele erikseen, vaan jakaa aivot. Mielestäni tämä on Rubinin todellinen tappajaveto: ei pelkästään laitteistoparametrien pinoaminen, vaan koko järjestelmän datavirran uudelleenjärjestely. 3) Jos MOE (Hybrid Expert Model Architecture) on mittojen pienentämisen isku Nvidian "väkivaltaisen pinouksen kortti" -liiketoimintamallille nousevien tähtien, kuten DeepSeekin, toimesta, niin Rubin on Lao Huangin strateginen vastahyökkäys katsotpa sitä miten tahansa. Tietenkin tämä temppu tarkoittaa myös sitä, että Nvidian täytyy hyvästellä vanha väkivaltainen korttipinomalli. Lao Huang laskee toisen kertomuksen, että jos Agenttikausi todella osuu tuhansiin teollisuudenaloihin, sen täytyy ylittää token-kustannusten raja, joka on yleinen trendi, jota Nvidia ei pysty ylläpitämään. Lao Huangin näkemyksen mukaan sen sijaan, että odottaisi Googlen, Metan ja muiden suurten valmistajien tunkeutumista markkinoille tai DeepSeekin ja muiden mallien alistamista, on parempi ottaa aloite ja olla se, joka rikkoo pelin. 4) Kysymys kuuluu, miten Nvidia käsittelee itseään itsevallankumouksen jälkeen? Polku on myös hyvin selvä: "näytönohjainten myynnistä" "järjestelmien myyntiin", muutaman suuren valmistajan palvelemisesta tekoälyn todella suosituksi. Aiemmin, kun ostit H100:n, Nvidia ansaitsi rahaa näytönohjaimesta, ja Rubin kertoo sinulle tulevaisuudessa: sinun täytyy ostaa täydellinen sarja NVL72-räkkiä – 72 GPU:ta, NVLink Switch, täysi nestemäinen jäähdytysjärjestelmä, kaapit ja jopa tukevat ohjelmistopinot, kaikki pakattuna ja myytyinä sinulle. Lao Huangin abakus on myös hyvin selkeä, vaikuttaa siltä, että pakattujen laitteiden hinta on kalliimpi, mutta äärimmäisen järkeilyn tehokkuuden myötä ostajan tekoälyn yksikköhinta laskee, eikä se luonnollisesti menetä markkinaosuutta. Mutta pienten ja keskisuurten toimijoiden kynnys on myös korkeampi. Vain suuret valmistajat ja pilvipalveluntarjoajat voivat pelata, mikä pahentaisi entisestään laskentatehon monopolia. Nykyisessä kilpailutilanteessa sitä voi kutsua suureksi uhkapeliksi, sillä kun HBM4:n massatuotannossa ilmenee ongelmia, se korvataan AMD:n, Google TPU:n ja muiden vaihtoehtojen tarjoamilla vaihtoehdoilla, jotka valtaavat ikkunan, ja Nvidian unelma järjestelmän myymisestä ei välttämättä ole niin helppo toteuttaa.