Astăzi, ni se alătură @rdn_nikita, cofondator și CEO al @FlexionRobotics, pentru a discuta diferența dintre capacitățile robotice actuale și ceea ce este necesar pentru a implementa roboți complet autonomi în lumea reală. Nikita explică cum învățarea prin întărire și simularea au condus progresul rapid în locomoția roboților — și de ce locomoția este încă departe de a fi "rezolvată". Analizăm diferența sim2real și modul în care adăugarea de intrări vizuale introduce zgomot și complică semnificativ transferul de la sim-to-real. De asemenea, explorăm dezbaterea dintre modelele end-to-end și abordările modulare și de ce separarea locomoției, planificării și semantică rămâne astăzi o abordare pragmatică. Nikita introduce, de asemenea, conceptul de "real-to-sim", care folosește date din lumea reală pentru a rafina parametrii de simulare pentru antrenamentul de fidelitate superioară, discută modul în care învățarea prin întărire, învățarea prin imitație și datele de teleoperare sunt combinate pentru a antrena politici robuste atât pentru roboți patrupedeți, cât și pentru roboți umanoizi, și introduce abordarea ierarhică a Flexion, care utilizează modele de viziune-limbaj (VLM) pre-antrenate pentru orchestrarea sarcinilor la nivel înalt cu modele Vision-Language-Action (VLA) și la nivel scăzut Dispozitive de urmărire pe tot corpul. În final, Nikita împărtășește culisele demonstrațiilor roboților umanoizi, perspectiva sa despre învățarea prin întărire în simulare versus lumea reală, nuanțele acordării recompenselor și oferă sfaturi practice pentru cercetători și practicieni care doresc să înceapă astăzi în robotică. 🗒️ Pentru lista completă a resurselor pentru acest episod, vizitați pagina de note ale emisiunii: 📖 CAPITOLE =============================== 00:00 - Introducere 04:07 - S-a rezolvat locomoția robotului? 06:04 - Diferență Sim-la-real 08:58 - Adăugarea semanticii politicilor 09:42 - Arhitecturi modulare vs end-to-end 10:29 - Model de planificator 12:21 - Adaptarea tehnicilor RL de la patrupede la umanoizi 15:39 - În spatele demonstrațiilor roboților 18:09 - Roboți umanoizi în medii de acasă 22:03 - Abordare de antrenament 23:56 - Modele VLA 27:59 - Reducerea distanței dintre simulator și realitate 32:55 - Orchestrarea sarcinilor folosind VLM-uri 36:38 - Utilizarea uneltelor 38:10 - Ierarhia modelelor 43:37 - Simulator versus mediu de simulare 44:57 - Combinarea învățării prin imitație și învățarea prin întărire 46:42 - RL în lumea reală versus RL în simulare 52:58 - Ajustarea recompenselor și funcțiile de valoare în robotică 56:38 - Predicții 1:00:10 - Umanoizi, patrupede și platforme cu roți 1:02:45 - Sfaturi, kituri de roboți recomandate și pla comunitar