Jeg er på et enkelt oppdrag for å løse Physical Turing-testen for robotikk. Det er den neste, eller kanskje DEN siste store utfordringen for AI. Superintelligens i tekststrenger vil vinne en Nobelpris før vi har sjimpanseintelligens i smidighet og fingerferdighet. Moravecs paradoks er en forbannelse som skal brytes, en mur som skal rives ned. Ingenting kan stå mellom menneskeheten og eksponentiell fysisk produktivitet på denne planeten, og kanskje en dag på planeter utenfor. Vi startet et lite laboratorium hos NVIDIA og vokste nylig til 30 ansatte. Laget slår langt over sin egen vektklasse. Vårt forskningsspor spenner over grunnleggende modeller, verdensmodeller, kroppslig resonnement, simulering, helkroppskontroll og mange varianter av RL – i bunn og grunn hele spekteret av robotlæring. I år lanserte vi: - GR00T VLA (vision-language-action) grunnmodeller: åpen kildekode N1 i mars, N1.5 i juni, og N1.6 denne måneden; - GR00T Dreams: videoverdensmodell for skalering av syntetiske data; - SONIC: humanoid helkroppskontrollgrunnlagsmodell; - RL etter trening for VLAs og RL-oppskrifter for sim2real. Dette ville ikke vært mulig uten de mange samarbeidende teamene hos NVIDIA, sterk ledelsesstøtte og medforfattere fra universitetslaboratorier. Takk til alle som tror på oppdraget. Tråd om galleriet av milepæler: