Idag har vi med oss @rdn_nikita, medgrundare och VD för @FlexionRobotics, för att diskutera gapet mellan dagens robotkapacitet och vad som krävs för att införa helt autonoma robotar i verkligheten. Nikita förklarar hur förstärkningsinlärning och simulering har drivit snabba framsteg inom robotrörelse – och varför rörelse fortfarande är långt ifrån "löst." Vi gräver i sim2real-gapet och hur tillägg av visuella inmatningar introducerar brus och avsevärt komplicerar överföring från simulering till verklighet. Vi utforskar också debatten mellan end-to-end-modeller och modulära metoder, och varför separeringen av lokomotion, planering och semantik fortfarande är en pragmatisk metod idag. Nikita introducerar också begreppet "real-to-sim", som använder verkliga data för att förfina simuleringsparametrar för högre fidelitetsträning, diskuterar hur förstärkningsinlärning, imitationsinlärning och teleoperationsdata kombineras för att träna robusta policyer för både fyrbenta och humanoida robotar, och introducerar Flexions hierarkiska metod som använder förtränade Vision-Language Models (VLM) för högnivå-uppgiftsorkestrering med Vision-Language-Action (VLA)-modeller och lågnivåmodeller Hela kroppsspårare. Slutligen delar Nikita med sig av bakom kulisserna i demos av humanoida robotar, sin syn på förstärkningsinlärning i simulering jämfört med verkliga världen, nyanserna i belöningsjustering och erbjuder praktiska råd till forskare och praktiker som vill börja med robotik idag. 🗒️ För hela listan över resurser för detta avsnitt, besök sidan för showanteckningar: 📖 KAPITEL =============================== 00:00 - Introduktion 04:07 - Är robotens rörelse löst? 06:04 - Sim-till-verklig lucka 08:58 - Lägger till semantik i policyer 09:42 - Modulära vs end-to-end-arkitekturer 10:29 - Planerarmodellen 12:21 - Anpassning av RL-tekniker från fyrbenta till humanoider 15:39 - Bakom robotdemonstrationer 18:09 - Humanoida robotar i hemmiljöer 22:03 - Träningsmetod 23:56 - VLA-modeller 27:59 - Minskar gapet mellan sim-och-verklig 32:55 - Uppgiftsorkestrering med VLM 36:38 - Verktygsanvändning 38:10 - Modellhierarki 43:37 - Simulator kontra simuleringsmiljö 44:57 - Kombinerar imitationsinlärning och förstärkningsinlärning 46:42 - RL i verkliga världen jämfört med RL i simulering 52:58 - Belöningsjustering och värdefunktioner inom robotik 56:38 - Förutsägelser 1:00:10 - Humanoider, quadroped och hjulplattformar 1:02:45 - Råd, rekommenderade robotkit och community-PL