Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Haotian | CryptoInsight
Cercetător independent | Consilier @ambergroup_io | Cercetător special @IOSGVC| Hardcore Science | Anterior:@peckshield | DM-uri pentru Collab| Comunitatea este deschisă doar abonaților Twitter
#OKX @star_okx de orez de Revelion chinezesc pe cal a spus-o atât de bine și a atins punctele sensibile ale industriei în mijlocul conversației și râsetelor!
Dacă fundalul cripto este doar o cultură ostilă a cazinourilor precum "stud", "PVP", "xx life" și "100x bogat", atunci de fapt distrugem viitorul acestei industrii cu propriile noastre mâini și în plus pierdem $BTC în propriile noastre mâini.
Pe măsură ce stablecoin-urile, RWA, AI+Crypto, DeFi etc. devin treptat mainstream, cripto nu mai este industria marginală detestată de cei din afară, ci o industrie paralelă cu adevărat echivalentă cu finanțele verticale tradiționale. Nu te bucura de beneficiile industriei în timp ce folosești "narațiuni vulgare ale jucătorilor" pentru a stigmatiza vechile noastre convingeri.
Refuzând să se eclipseze, Crypto merită o definiție mai bună.
4,5K
Am rămas fără cuvinte, iar în decurs de o săptămână, al doilea meu cont Claude a fost banat fără motiv.
Dar, sincer, de data asta nu a fost niciun val în inima mea și chiar am vrut să râd puțin. De ce?
Pentru că deja a văzut logica de bază a blocării inexplicabile și pentru că are un set de strategii de adaptare mai inteligente în mâini. Mai ales după o lună de lucru în direcția Vibe Coding, am stabilit un sistem de gândire matur pentru controlul AI, suficient pentru a lupta calm împotriva acestei "schimbări" bruște.
Să vorbim mai întâi despre motive, iar motivele sunt evidente: nu este altceva decât bătăile frecvente ale nodului VPN pentru a declanșa controlul riscului de la distanță, sau nepotrivirea dintre locul plății cardului Visa și IP-ul terminalului care declanșează un avertisment de securitate, sau consumul pe termen scurt și de frecvență înaltă de tokenuri este pur și simplu și grosolan, determinat de sistem ca un bot malițios.
Dar există un motiv mai profund: @claudeai Sea of Stars este un serviciu SaaS la nivel enterprise. Îi pasă de clienți mari, cum ar fi Fortune 500, iar Anthropic nu ține cont de utilizatorii individuali Pro sau Max, ca noi, care se bazează mult pe versiunea web și chiar o consideră un factor de risc incontrolabil.
Prin urmare, nu este nevoie să continuăm să ne luptăm cu problema interdicției. Cea mai importantă lecție pe care m-a învățat-o AI-ul: nu lega niciodată productivitatea ta de bază de un cont web extrem de volatil.
De fapt, soluția reală este construirea unui sistem de servicii de localizare AI independent de model:
1) Folosirea OpenRouter/Antigravity pentru a implementa rutarea accesului la model, retrogradarea Claude către un motor de inferență de bază care poate fi comutat oricând, pentru a evita blocarea;
2) Folosiți API-uri terțe echipate cu Claude Code + Skills + Cowork pentru a reconstrui un set de logică de interacțiune, abandonați cea mai incontrolabilă metodă de interacțiune a front-end-ului web și nu vă faceți griji pentru pierderea unui număr mare de prompturi/instrucțiuni de configurare și alte date cauzate de interzicere, lăsând AI-ul să rezide în sistemul dumneavoastră de fișiere pentru a oferi servicii;
3) Citește direct baza de cod locală prin protocolul MCP, apelează baza ta privată de cunoștințe în timp real cu Local RAG (Local Search Enhancement) și chiar execută automat teste, commit-uri Git și bucle de corectare a erorii în terminal.
Pe scurt, renunțarea la modelul de utilizare AI al "închirierii cloud" și înțelegerea activă a "suveranității locale" este forma supremă de Vibe Coding.
Ce este Vibe Coding dacă controlezi doar cel mai puternic model, dar nu poți controla dreptul inalienabil de a folosi modelul?
782
În timpul conferinței CES, noua arhitectură Rubin lansată de NVIDIA a devenit subiectul discuțiilor recente de piață, care este o altă descoperire majoră pe lângă arhitectura MOE, ce este adaptat pentru era Agentic AI etc., am privit mai atent și am simțit mirosul "auto-revoluției" lui Lao Huang:
1) În trecut, Nvidia s-a bazat pe avantajele hardware ale GPU-urilor, profitând de perioada de dividende când giganții majori ai AI cumpărau frenetic putere de calcul pentru a antrena modele mari. La acea vreme, logica era foarte simplă: cine avea mai multe plăci grafice putea antrena cel mai bun model.
Dar acum, războiul AI s-a mutat de la câmpul de luptă al "puterii de calcul" la "inferența", mai ales după apariția erei Agențice, AI trebuie să se ocupe de raționamente contextuale de înaltă frecvență, în mai mulți pași și ultra-lungi.
În acest moment, parametrii modelului sunt trilioane, debitul de date este extrem de mare, indiferent cât de rapidă este GPU-ul, dacă datele memoriei nu sunt suficient de rapide, GPU-ul trebuie să stea în repaus, ceea ce este "zidul de stocare", adică placa grafică nu mai poate rezolva problema și încă are nevoie de memorie video și lățime de bandă ridicate pentru a fi suportată. Asta încerca Rubin să rezolve.
2) Prin urmare, primul HBM4 al lui Rubin poate suporta a patra generație de memorie cu lățime de bandă mare, ceea ce poate face ca lățimea de bandă să ajungă la 22TB/s. Dar, mai important, cooperează cu tehnologia NVLink 6 (lățime de bandă de 260TB/s în rack), ceea ce transformă logic 72 de carduri într-un "cip uriaș".
Ce înseamnă asta? În trecut, când cumpărai o placă grafică, cumpărai componente independente, iar transmiterea datelor între plăci era ca un curier care trecea prin mai multe stații de transfer. Acum Rubin folosește interconexiuni cu densitate extrem de mare pentru a face fluxul de date între GPU-uri cu aproape nicio distanță fizică, iar 72 de angajați nu mai lucrează separat, ci împart creierul.
Cred că aceasta este mișcarea decisivă a lui Rubin: nu doar stivuirea parametrilor hardware, ci și refactorizarea fluxului de date al întregului sistem.
3) Dacă MOE (Hybrid Expert Model Architecture) este o lovitură de reducere a dimensiunii modelului de afaceri "violent stacking card" al Nvidia din partea unor stele în ascensiune precum DeepSeek, atunci Rubin este un contraatac strategic al lui Lao Huang, indiferent cum îl privești. Desigur, acest truc înseamnă și că Nvidia trebuie să-și ia rămas bun de la vechiul model de stacking violent de cărți.
Lao Huang calculează un alt cont: dacă era Agentic chiar ajunge în mii de industrii, trebuie să treacă de barierul costului tokenului, care este tendința generală pe care Nvidia nu o poate respecta.
În opinia lui Lao Huang, în loc să așteptăm să fie invadați de Google, Meta și alți mari producători pentru a pătrunde pe piață sau să fie subminați de DeepSeek și alte modele, este mai bine să luăm inițiativa pentru a fi cel care strică jocul.
4) Întrebarea este: cum se va descurca Nvidia cu ea însăși după auto-revoluție? Drumul este, de asemenea, foarte clar, de la "vânzarea plăcilor grafice" la "vânzarea sistemelor", de la deservirea câtorva producători mari până la popularizarea AI-ului cu adevărat.
În trecut, când ai cumpărat H100, Nvidia câștiga bani din placa video, iar Rubin îți va spune în viitor: trebuie să cumperi un set complet de rack-uri NVL72 - 72 GPU-uri, un switch NVLink, sistem complet de răcire cu lichid, dulapuri și chiar stive software de suport, toate ambalate și vândute ție.
Abacul lui Lao Huang este, de asemenea, foarte clar: se pare că costul hardware-ului ambalat este mai scump, dar cu adăugarea unei eficiențe extreme de raționament, costul unitar al AI-ului cumpărătorului este redus și, în mod natural, nu va pierde cotă de piață.
Dar pragul pentru jucătorii mici și mijlocii este, de asemenea, mai ridicat. Doar marii producători și furnizorii de servicii cloud își permit să joace, ceea ce va agrava și mai mult monopolul puterii de calcul. În situația competitivă actuală, poate fi numit un pariu mare, pentru că, odată ce va apărea o problemă cu producția în masă a HBM4, aceasta va fi înlocuită de alternative lansate de AMD, Google TPU și alte alternative care profită de perioada ferestrei, iar visul Nvidia de a vinde sistemul s-ar putea să nu fie atât de ușor de realizat.
952
Limită superioară
Clasament
Favorite