I dag har vi med oss @rdn_nikita, medgründer og administrerende direktør i @FlexionRobotics, for å diskutere gapet mellom dagens robotkapasiteter og hva som kreves for å ta i bruk fullt autonome roboter i den virkelige verden. Nikita forklarer hvordan forsterkningslæring og simulering har drevet rask fremgang i robotbevegelse – og hvorfor bevegelse fortsatt er langt fra «løst». Vi går i dybden på sim-til-real-gapet, og hvordan det å legge til visuelle input introduserer støy og betydelig kompliserer overføring fra sim til virkelighet. Vi utforsker også debatten mellom ende-til-ende-modeller og modulære tilnærminger, og hvorfor det fortsatt er en pragmatisk tilnærming å skille mellom lokomotion, planlegging og semantikk i dag. Nikita introduserer også konseptet «real-to-sim», som bruker virkelige data for å forbedre simuleringsparametere for høyere nøyaktighetstrening, diskuterer hvordan forsterkningslæring, imitasjonslæring og teleoperasjonsdata kombineres for å trene robuste retningslinjer for både firbeinte og humanoide roboter, og introduserer Flexions hierarkiske tilnærming som benytter forhåndstrente Vision-Language Models (VLM) for høynivå oppgaveorkestrering med Vision-Language-Action (VLA)-modeller og lavnivå Hele kroppens trackere. Til slutt deler Nikita erfaringene bak kulissene i demoer av humanoide roboter, sitt syn på forsterkningslæring i simulering versus den virkelige verden, nyansene ved belønningsjustering, og gir praktiske råd til forskere og praktikere som ønsker å komme i gang med robotikk i dag. 🗒️ For den fullstendige listen over ressurser for denne episoden, besøk siden med showets notater: 📖 KAPITLER =============================== 00:00 - Introduksjon 04:07 - Er robotbevegelse løst? 06:04 - Sim-til-virkelighet-gap 08:58 - Legge til semantikk i policyer 09:42 - Modulære vs ende-til-ende-arkitekturer 10:29 - Planleggermodellen 12:21 - Tilpasning av RL-teknikker fra firbeinte til humanoider 15:39 - Bak robotdemonstrasjoner 18:09 - Humanoide roboter i hjemmemiljøer 22:03 - Treningstilnærming 23:56 - VLA-modeller 27:59 - Lukker gapet mellom simulering og virkelighet 32:55 - Oppgaveorkestrering ved bruk av VLM-er 36:38 - Bruk av verktøy 38:10 - Modellhierarki 43:37 - Simulator versus simuleringsmiljø 44:57 - Kombinerer imitasjonslæring og forsterkningslæring 46:42 - RL i virkeligheten versus RL i simulering 52:58 - Belønningsjustering og verdifunksjoner i robotikk 56:38 - Spådommer 1:00:10 - Humanoider, quadropeds og hjulplattformer 1:02:45 - Råd, anbefalte robotsett og fellesskapets PL