Actualizare de viață: am decis să plec de la 1X. A fost o onoare să ajut la creșterea companiei. M-am alăturat Halodi Robotics în 2022 (numele anterior al companiei) ca singurul angajat din California. La acea vreme, eram cam 40 de locuitori din Norvegia și 2 în Texas. Prima mea angajată și eu am lucrat din garaj câteva luni ca să economisim bani. Astăzi, 1X este format din sute de oameni, cu hardware, design, software, inteligență artificială, producție și produse, toate mutate în zona golfului SF, funcționând la capacitate maximă și lucrând la pregătirea NEO pentru casă. Un mare mulțumesc tuturor colegilor mei cu care am lucrat. A fost o decizie grea să plec. Când lucrezi într-un startup interesant care crește rapid, există întotdeauna atât de multe de făcut și niciodată un moment perfect pentru a merge mai departe. Avem mai multe lucrări în pregătire care sunt foarte interesante pentru că avansează semnificativ autonomia generală și scalabilitatea abordării noastre de implementare și arată cu adevărat o cale realistă către funcționarea produsului. Actualizarea recentă a autonomiei Modelului Mondial este un exemplu și urmează și altele. Fabrica 1X este atât de interesantă. Lucrurile se accelerează într-o viteză care m-ar fi surprins acum câțiva ani. În 2022, majoritatea tehnologilor, cercetătorilor și investitorilor de capital de risc erau sceptici față de umanoizi și de învățarea imitativă la scară largă. "De ce picioare?" "Cum ar putea învățarea de la un capăt la altul să fie vreodată suficient de bună?" "De ce să mergi spre casă și nu pentru fabrică?" "Cum vom aduna vreodată suficiente date?" Fereastra Overton asupra roboticii cu scop general s-a schimbat mult de atunci. Deși suntem încă la începutul misiunii noastre, rămân încrezător că în curând roboții de casă vor fi la fel de comuni ca aparatele de aer condiționat, mașinile și ChatGPT. Doar vorbește cu botul, iar acesta va merge și va rezolva totul în liniște. Economii întregi se vor reorganiza în cele din urmă în jurul acestei tehnologii. Oamenii înțeleg acum. Ce urmează? Cred că progresul în învățarea profundă aplicată depinde, în general, de "valorificarea magiei" câtorva obiecte magice. Aceste obiecte magice au mult mai multă putere de generalizare decât te-ai aștepta în mod normal. Doar să ceri LLM-ului să înțeleagă ce vrei este magie. Modelele de generare video sunt magice. Raționamentul este magie. Nu dai peste un obiect magic în fiecare zi, dar când o faci, te asiguri că îl iei și îl pui la treabă pentru a crea ceva util în robot. O mare parte din convingerile mele timpurii despre direcția în care se îndrepta robotica au fost lucrând la BC-Z între 2018-2021. "Obiectul magic" pe care am pariat atunci a fost surprinzătoarea capacitate de absorbție a datelor ale învățării supravegheate și "doar să cer generalizare". Aceasta a fost un pionier al multor ingrediente standard pe care le vedem astăzi în VLA-uri: - Generalizarea la comenzi de limbaj nevăzute - DAgger ghidat de om pentru îmbunătățirea politicilor - Predicții auxiliare în buclă deschisă + controlul orizontului retras, cunoscut și ca fragmentarea acțiunii - Manipularea punctelor cheie pentru îmbunătățirea servoing-ului - Simple ResNet18 cu condiționare FiLM pe intrări multimodale Următorul "obiect magic" pe care am pariat la 1X au fost modelele video, pentru că sunt clar obiecte magice care învață o distribuție a datelor nu foarte diferită de ceea ce are nevoie un robot să învețe. Se generalizează surprinzător de bine. Simt din nou că există mai multe obiecte magice în joc acum, ceea ce deschide multe posibilități noi pentru robotică și dincolo de ea. Îmi ia câteva luni să-mi golesc paharul de antecedente și să capăt o perspectivă proaspătă. Când am plecat de la Google în 2022, am petrecut cam 2 săptămâni hotărând ce să fac mai departe. De data aceasta, vreau să iau mult mai mult timp pentru a pune la curent cu ce s-a întâmplat în domeniul AI + robotică. Am reimplementat câteva lucrări despre deep learning. Lucrez la un tutorial mare pentru blogul meu. Învăț toate trucurile de utilizator avansat ale lui Claude. Citesc postările de pe blogul Thinking Machines ca să înțeleg ce fel de experimente se desfășoară la laboratoarele Frontier. Citesc teza lui Ben Katz din 2016 despre actuatorul Mini-ghepard. Voi călători în China în martie pentru a întâlni companii incredibile din ecosistemul robotic chinez. Acum, mai mult ca oricând, este timpul ca atât oamenii, cât și mașinile să învețe. Următorul simbol al secvenței mele de viață va fi unul important. Colegilor și investitorilor care au pariat pe 1X devreme, chiar înainte să devenim un nume cunoscut – vă mulțumesc din toată inima. Nu o să uit♥️