Tipul care a inventat arhitectura cipului în 99% din procesoarele spune că GPU-urile NVIDIA sunt complet greșite pentru această eră a AI... Argumentul său: GPU-urile au fost proiectate pentru antrenament. Dar inferența, acolo unde se fac toți banii, este o problemă fundamental diferită Este legat de memorie și secvențial. Și niciun cip nu a fost proiectat vreodată special pentru asta. Fiecare GPU și TPU folosit astăzi pentru inferență este doar un cip de antrenament redus. Adevăratul blocaj este memoria. Și fiecare tendință care entuziasmează cel mai mult industria (MoE, raționament, context lung, multimodal) agravează problema memoriei. Următorul ciclu hardware de $100B+ va fi câștigat de cel care rezolvă primul peretele de memorie