Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
Director de robotică NVIDIA și om de știință distins. Co-lider al laboratorului GEAR. Rezolvarea AGI fizică, un motor la un moment dat. Stanford Ph.D. Primul stagiar OpenAI.
Observ un mini paradox al lui Moravec în robotică: gimnastica care este dificilă pentru oameni este mult mai ușoară pentru roboți decât sarcinile "nesexy" precum gătitul, curățenia și asamblarea. Duce la o disonanță cognitivă pentru oamenii din afara domeniului, "deci, roboții pot face parkour și breakdance, dar de ce nu pot avea grijă de câinele meu?" Credeți-mă, am fost întrebat de părinții mei despre asta mai mult decât credeți ...
"Paradoxul robotului Moravec" creează, de asemenea, iluzia că capacitățile fizice ale IA sunt mult mai avansate decât sunt în realitate. Nu evidențiez Unitree, deoarece se aplică pe scară largă tuturor demonstrațiilor acrobatice recente din industrie. Iată un test simplu: dacă instalați un perete în fața robotului care se întoarce lateral, acesta se va izbi de el cu toată forța și va face un spectacol. Pentru că este doar supraajustarea acelei singure mișcări de referință, fără nicio conștientizare a împrejurimilor.
Iată de ce există paradoxul: este mult mai ușor să antrenezi o "gimnastă oarbă" decât un robot care vede și manipulează. Prima poate fi rezolvată în întregime în simulare și transferată în lumea reală, în timp ce cea de-a doua necesită o redare extrem de realistă, fizică de contact și dinamică dezordonată a obiectelor din lumea reală - niciuna dintre acestea nu poate fi simulată bine.
Imaginați-vă că puteți antrena LLM-uri nu de pe internet, ci dintr-un joc de consolă text pur manual. Roboticienii au avut noroc. Se întâmplă să trăim într-o lume în care motoarele fizice accelerate sunt atât de bune încât putem scăpa cu acrobații impresionante folosind literalmente zero date reale. Dar nu am descoperit încă același cod de trișare pentru dexteritate generală.
Până atunci, vom fi în continuare interogați de părinții noștri confuzi.
318,96K
Barul meu pentru AGI este mult mai simplu: un AI care gătește o cină bună acasă la oricine pentru orice bucătărie. Testul Turing fizic este foarte probabil mai greu decât Premiul Nobel. Paradoxul lui Moravec va continua să ne bântuie, se profilează mai mare și mai întunecat, în deceniul următor.

Thomas Wolf19 iul., 16:06
Bara mea pentru AGI este o inteligență artificială care câștigă un premiu Nobel pentru o nouă teorie pe care a creat-o.
99,03K
Am fost puțin tăcut pe X în ultima vreme. Anul trecut a fost o experiență transformațională. Grok-4 și Kimi K2 sunt minunate, dar lumea roboticii este un minunat vest sălbatic. Se simte ca NLP în 2018 când a fost publicat GPT-1, împreună cu BERT și o mie de alte flori care au înflorit. Nimeni nu știa care dintre ele va deveni în cele din urmă ChatGPT. Dezbaterile au fost aprinse. Entropia era foarte mare. Ideile erau nebunește de distractive.
Cred că GPT-1 al roboticii este deja undeva pe Arxiv, dar nu știm exact care. Ar putea fi modele mondiale, RL, învățarea din video uman, sim2real, real2sim, etc. etc, sau orice combinație a acestora. Dezbaterile sunt aprinse. Entropia este foarte mare. Ideile sunt incredibil de distractive, în loc să stoarcă ultimele câteva procente pe AIME și GPQA.
Natura roboticii complică foarte mult spațiul de proiectare. Spre deosebire de lumea curată a biților pentru LLM-uri (șiruri de text), noi, roboticienii, trebuie să ne ocupăm de lumea dezordonată a atomilor. La urma urmei, există o bucată de metal definit de software în buclă. Normalii LLM ar putea fi greu de crezut, dar până acum roboticienii încă nu se pot pune de acord asupra unui punct de referință! Diferiți roboți au capabilități diferite - unii sunt mai buni la acrobație, în timp ce alții la manipularea obiectelor. Unele sunt destinate uzului industrial, în timp ce altele sunt pentru sarcini casnice. Întruchiparea încrucișată nu este doar o noutate de cercetare, ci o caracteristică esențială pentru un creier robot universal.
Am vorbit cu zeci de lideri de la diverse companii de roboți, vechi și noi. Unii vând întregul corp. Unii vând părți ale corpului, cum ar fi mâinile îndemânatice. Mulți alții vând lopețile pentru a fabrica corpuri noi, pentru a crea simulări sau pentru a colecta comori masive de date. Spațiul ideilor de afaceri este la fel de sălbatic ca cercetarea în sine. Este o nouă goană după aur, cum nu am mai văzut de la valul ChatGPT din 2022.
Cel mai bun moment pentru a intra este atunci când lipsa de consens atinge vârful. Suntem încă la începutul unei curbe de pierdere - există semne puternice de viață, dar foarte, departe de convergență. Fiecare pas de gradient ne duce în necunoscut. Dar un lucru știu sigur - nu există AGI fără atingere, simțire și întrupare în lumea dezordonată.
Într-o notă mai personală - conducerea unui laborator de cercetare vine cu un nivel cu totul nou de responsabilitate. A oferi actualizări direct CEO-ului unei companii de 4 trilioane de dolari este, ca să spunem ușor, atât palpitant, cât și consumatoare de greutatea atenției mele. S-au dus zilele în care puteam să fiu la curent și să mă scufund adânc în fiecare știre AI.
Voi încerca să-mi fac timp pentru a împărtăși mai mult din călătoria mea.

876,94K
Testul Turing fizic: casa ta este o mizerie completă după un hackathon de duminică. Luni seara, ajungi acasă într-o cameră de zi imaculată și la o cină la lumina lumânărilor. Și nu puteai spune dacă un om sau o mașină fusese acolo. Înșelător de simplu, nebunește de greu.
Este următoarea stea polară a AI. Visul care mă ține treaz la 12 dimineața la laborator. Viziunea pentru următoarea platformă de calcul care automatizează bucăți de atomi în loc de bucăți de biți.
Mulțumesc Sequoia pentru că m-a găzduit la AI Ascent! Mai jos este discursul meu complet despre primele principii pentru a rezolva robotica de uz general: cum ne gândim la strategia de date și la legile de scalare. Vă asigur că vor fi 17 minute pe care nu le regretați!
107,21K
Într-o zi din următorul deceniu, vom avea roboți în fiecare casă, fiecare spital și fabrică, făcând toate sarcinile plictisitoare și periculoase cu dexteritate supraomenească. Acea zi va fi cunoscută sub numele de "joi". Nici măcar Turing nu ar îndrăzni să viseze la viața noastră în cele mai îndrăznețe vise ale sale.

signüll21 apr. 2025
we crossed the turing test & no one gave a shit. no parades. no front page headlines. just… a casual shrug. like “oh yeah, the machines are smart enough to fool us now. anyway, what’s for lunch?”
that silence tells you everything about the pace we’re moving at.
back in my cs classes, the turing test was treated like the final boss. now every break through is another god damn tuesday.
101,94K
Jocurile Olimpice umanoide din 2030 vor fi un spectacol

Jim Fan5 feb. 2025
Am trimis roboți umanoizi lui Cristiano Ronaldo, LeBron James și Kobe Byrant! Acestea sunt rețele neuronale care rulează pe hardware real în laboratorul nostru GEAR. Majoritatea demonstrațiilor de roboți pe care le vedeți online accelerează videoclipurile. De fapt, le încetinim, astfel încât să vă puteți bucura de mișcările fluide.
Sunt încântat să anunț "ASAP", un model "real2sim2real" care stăpânește mișcări extrem de fluide și dinamice pentru controlul întregului corp umanoid.
Mai întâi antrenăm robotul în simulare, dar există un decalaj notoriu "sim2real": este foarte dificil ca ecuațiile fizice proiectate manual să se potrivească cu dinamica lumii reale.
Soluția noastră este simplă: trebuie doar să implementați o politică pre-antrenată pe hardware real, să colectați date și să redați mișcarea în simulare. Reluarea va avea evident multe erori, dar asta oferă un semnal bogat pentru a compensa discrepanța fizică. Utilizați o altă rețea neuronală pentru a învăța delta. Practic, "reparăm" un motor fizic tradițional, astfel încât robotul să poată experimenta aproape lumea reală la scară în GPU-uri.
Viitorul este simularea hibridă: combinați puterea motoarelor clasice de simulare rafinate de-a lungul deceniilor și capacitatea ciudată a NN-urilor moderne de a surprinde o lume dezordonată.
45,82K
Am trimis roboți umanoizi lui Cristiano Ronaldo, LeBron James și Kobe Byrant! Acestea sunt rețele neuronale care rulează pe hardware real în laboratorul nostru GEAR. Majoritatea demonstrațiilor de roboți pe care le vedeți online accelerează videoclipurile. De fapt, le încetinim, astfel încât să vă puteți bucura de mișcările fluide.
Sunt încântat să anunț "ASAP", un model "real2sim2real" care stăpânește mișcări extrem de fluide și dinamice pentru controlul întregului corp umanoid.
Mai întâi antrenăm robotul în simulare, dar există un decalaj notoriu "sim2real": este foarte dificil ca ecuațiile fizice proiectate manual să se potrivească cu dinamica lumii reale.
Soluția noastră este simplă: trebuie doar să implementați o politică pre-antrenată pe hardware real, să colectați date și să redați mișcarea în simulare. Reluarea va avea evident multe erori, dar asta oferă un semnal bogat pentru a compensa discrepanța fizică. Utilizați o altă rețea neuronală pentru a învăța delta. Practic, "reparăm" un motor fizic tradițional, astfel încât robotul să poată experimenta aproape lumea reală la scară în GPU-uri.
Viitorul este simularea hibridă: combinați puterea motoarelor clasice de simulare rafinate de-a lungul deceniilor și capacitatea ciudată a NN-urilor moderne de a surprinde o lume dezordonată.
543,13K
Că o a doua lucrare a căzut cu tone de secrete RL și raționament *multimodal* în stil o1 nu este pe cardul meu de bingo astăzi. Lucrările lui Kimi (un alt startup) și ale DeepSeek au convergat în mod remarcabil spre constatări similare:
> Nu este nevoie de căutări complexe în arbore precum MCTS. Doar liniarizați urmele de gândire și faceți o predicție autoregresivă veche;
> Nu este nevoie de funcții de valoare care necesită o altă copie costisitoare a modelului;
> Nu este nevoie de modelarea recompensei dense. Bazați-vă cât mai mult posibil pe adevărul de bază, rezultatul final.
Diferenţele:
> DeepSeek face abordarea AlphaZero - pur și simplu bootstrap prin RL fără intervenție umană, adică "pornire la rece". Kimi are abordarea AlphaGo-Master: SFT ușor pentru a se încălzi prin urme CoT proiectate prompt.
> greutăți DeepSeek sunt licența MIT (leadership de gândire!); Kimi nu are încă o autorizație de model.
> Kimi arată performanțe multimodale puternice (!) pe benchmark-uri precum MathVista, care necesită înțelegere vizuală a geometriei, teste IQ etc.
> lucrare Kimi are MULT mai multe detalii despre designul sistemului: infrastructură RL, cluster hibrid, sandbox de cod, strategii de paralelism; și detalii de învățare: context lung, compresie CoT, curriculum, strategie de eșantionare, generare de cazuri de testare etc.
Lecturi optimiste într-o vacanță!

300,43K
Limită superioară
Clasament
Favorite
La modă pe lanț
La modă pe X
Principalele finanțări recente
Cele mai importante