Livsoppdatering: Jeg har bestemt meg for å slutte 1X. Det har vært en ære å hjelpe til med å vokse selskapet. Jeg begynte i Halodi Robotics i 2022 (selskapets tidligere navn) som den eneste ansatte basert i California. På den tiden var vi rundt 40 med base i Norge og 2 i Texas. Min første ansatte og jeg jobbet fra garasjen i noen måneder for å spare penger. I dag er 1X hundrevis av mennesker, med maskinvare, design, programvare, kunstig intelligens, produksjon og produkt som alle er flyttet til SF Bay-området, hvor de fyrer på alle sylindrene og jobber med å gjøre NEO klart for hjemmet. En stor takk til alle kollegene jeg har jobbet med. Det var en vanskelig avgjørelse å dra. Når man jobber i en spennende oppstartsbedrift som vokser raskt, er det alltid så mye å gjøre og aldri et perfekt tidspunkt å gå videre på. Vi har flere prosjekter på gang som er så spennende fordi de i stor grad fremmer generell autonomi og skalerbarhet i vår implementeringsmetode, og virkelig viser en realistisk vei mot at produktet fungerer. Den nylige oppdateringen av World Model autonomi er ett eksempel, og det kommer flere. 1X-fabrikken er så spennende. Ting akseler i et tempo jeg ville blitt overrasket over for noen år siden. I 2022 var de fleste teknologer, forskere og VC-er skeptiske til humanoider og storskala imitasjonslæring. "Hvorfor Legs?" "Hvordan kan ende-til-ende-læring noen gang være godt nok?" "Hvorfor gå for hjemmet og ikke fabrikken?" "Hvordan skal vi noen gang samle nok data?" Overton-vinduet for generell robotikk har endret seg mye siden den gang. Selv om vi fortsatt er tidlig i oppdraget vårt, er jeg fortsatt trygg på at husroboter snart vil være like vanlige som klimaanlegg, biler og ChatGPT. Bare snakk med boten, så går den og gjør det stille og rolig. Hele økonomier vil til slutt omorganisere seg rundt denne teknologien. Folk forstår det nå. Hva blir det neste? Jeg mener at fremgang innen anvendt dyp læring generelt avhenger av å «utnytte magien» i noen få magiske objekter. Disse magiske objektene har langt mer generaliseringskraft enn man normalt skulle tro. Bare å be LLM-en forstå hva du vil er magisk. Videogenereringsmodeller er magiske. Resonnering er magi. Du støter ikke på et magisk objekt hver dag, men når du gjør det, sørger du for å ta det og bruke det for å lage noe nyttig i roboten på en eller annen måte. Mye av min tidlige overbevisning om hvor robotikk var på vei, var å jobbe med BC-Z fra 2018 til 2021. Det «magiske objektet» jeg satset på den gangen, var de overraskende dataabsorberende evnene til overvåket læring og «bare be om generalisering». Dette banet vei for mange av de standardingrediensene vi ser i VLA-er i dag: - Generalisering til usynlige språkkommandoer - Menneskestyrt DAgger for policyforbedring - Åpen sløyfe-hjelpeprediksjon + kontroll av tilbaketrukket horisont, også kjent som action chunking - Manipulasjonsnøkkelpunkter for å forbedre servoføringen - Enkel ResNet18 med FiLM-betinging på multimodale innganger Det neste «magiske objektet» vi satset på på 1X var videomodeller, fordi de tydeligvis er magiske objekter som lærer en datafordeling ikke så ulik det en robot trenger å lære. De generaliserer overraskende godt. Jeg føler igjen at det nå er flere magiske objekter i spill, noe som åpner mange nye muligheter for robotikk og mer. Jeg bruker noen måneder på å tømme koppen min for tidligere straffer og få et nytt perspektiv. Da jeg forlot Google i 2022, brukte jeg omtrent to uker på å bestemme hva jeg skulle gjøre videre. Denne gangen vil jeg bruke mye mer tid på å ta igjen det som har skjedd innen det bredere AI + robotikkområdet. Jeg har reimplementert noen dyp læringsartikler. Jeg jobber med en stor veiledning for bloggen min. Jeg lærer alle Claude power user-triksene. Jeg leser blogginnleggene til Thinking Machines for å forstå hvilke typer eksperimenter som utføres ved Frontier Labs. Jeg leser Ben Katz' avhandling fra 2016 om Mini-gepardaktuatoren. Jeg reiser til Kina i mars for å møte utrolige selskaper i det kinesiske robotikkøkosystemet. Nå, mer enn noen gang, er tiden inne for både mennesker og maskiner å lære. Neste tegn på livssekvensen min vil være viktig. Til kolleger og investorer som satset på én gang tidlig, selv før vi ble et kjent navn – jeg takker dere av hele mitt hjerte. Jeg vil ikke glemme det♥️