Dnes se k nám připojuje @rdn_nikita, spoluzakladatel a generální ředitel společnosti @FlexionRobotics, abychom probrali rozdíl mezi současnými schopnostmi robotů a tím, co je potřeba k nasazení plně autonomních robotů v reálném světě. Nikita vysvětluje, jak posilované učení a simulace urychlily rychlý pokrok v robotické lokomoci—a proč je lokomoce stále daleko od "vyřešení". Zabýváme se mezerou sim2real a tím, jak přidání vizuálních vstupů přináší šum a výrazně komplikuje přenos simulace do reality. Zkoumáme také debatu mezi end-to-end modely a modulárními přístupy a proč je oddělení pohybu, plánování a sémantiky dnes stále pragmatickým přístupem. Nikita také představuje koncept "real-to-sim", který využívá reálná data k zpřesnění parametrů simulace pro trénink vyšší věrnosti, diskutuje, jak se kombinují data posilovaného učení, imitace a teleoperace k trénování robustních politik jak pro čtyřnohé, tak humanoidní roboty, a představuje hierarchický přístup Flexionu, který využívá předtrénované modely Vision-Language Models (VLM) pro koordinaci úkolů na vysoké úrovni s modely Vision-Language-Action (VLA) a nízkoúrovňovými modely Celotělové trackery. Nakonec Nikita sdílí zákulisní ukázky humanoidních robotů, svůj pohled na posilované učení v simulaci oproti reálnému světu, nuance ladění odměn a nabízí praktické rady pro výzkumníky a praktiky, kteří chtějí dnes začít s robotikou. 🗒️ Pro kompletní seznam zdrojů k této epizodě navštivte stránku s poznámkami k pořadu: 📖 KAPITOLY =============================== 00:00 - Úvod 04:07 - Je robotická lokomoce vyřešena? 06:04 - Mezera mezi simulátorem a realitou 08:58 - Přidání sémantiky do politik 09:42 - Modulární vs end-to-end architektury 10:29 - Model plánovače 12:21 - Přizpůsobení RL technik ze čtyřnožců na humanoidy 15:39 - Ukázky Behind Robot 18:09 - Humanoidní roboti v domácím prostředí 22:03 - Tréninkové přiblížení 23:56 - VLA modely 27:59 - Uzavírání mezery mezi simulátorem a realitou 32:55 - Orchestrace úloh pomocí VLM 36:38 - Použití nástrojů 38:10 - Hierarchie modelu 43:37 - Simulátor versus simulační prostředí 44:57 - Kombinace imitačního učení a posilovaného učení 46:42 - RL v reálném světě versus RL v simulaci 52:58 - Ladění odměn a hodnotové funkce v robotice 56:38 - Předpovědi 1:00:10 - Humanoidi, kvadropedové a kolové platformy 1:02:45 - Rady, doporučené robotické sady a komunitní PLA