Oggi siamo accompagnati da @rdn_nikita, co-fondatore e CEO di @FlexionRobotics, per discutere il divario tra le attuali capacità robotiche e ciò che è necessario per implementare robot completamente autonomi nel mondo reale. Nikita spiega come l'apprendimento per rinforzo e la simulazione abbiano guidato un rapido progresso nella locomozione dei robot—e perché la locomozione è ancora lontana dall'essere "risolta". Approfondiamo il divario sim2real e come l'aggiunta di input visivi introduca rumore e complichi significativamente il trasferimento da simulazione a realtà. Esploriamo anche il dibattito tra modelli end-to-end e approcci modulari, e perché separare locomozione, pianificazione e semantica rimanga un approccio pragmatico oggi. Nikita introduce anche il concetto di "real-to-sim", che utilizza dati del mondo reale per affinare i parametri di simulazione per un addestramento di maggiore fedeltà, discute di come l'apprendimento per rinforzo, l'apprendimento per imitazione e i dati di teleoperazione siano combinati per addestrare politiche robuste sia per robot quadrupedi che per robot umanoidi, e introduce l'approccio gerarchico di Flexion che utilizza modelli Vision-Language pre-addestrati (VLM) per l'orchestrazione di compiti ad alto livello con modelli Vision-Language-Action (VLA) e tracker di corpo intero a basso livello. Infine, Nikita condivide i retroscena delle dimostrazioni di robot umanoidi, la sua opinione sull'apprendimento per rinforzo in simulazione rispetto al mondo reale, le sfumature della regolazione delle ricompense e offre consigli pratici per ricercatori e professionisti che desiderano iniziare nel campo della robotica oggi. 🗒️ Per l'elenco completo delle risorse per questo episodio, visita la pagina delle note dello show: 📖 CAPITOLI =============================== 00:00 - Introduzione 04:07 - La locomozione dei robot è risolta? 06:04 - Divario sim-to-real 08:58 - Aggiungere semantica alle politiche 09:42 - Architetture modulari vs end-to-end 10:29 - Modello pianificatore 12:21 - Adattare le tecniche di RL dai quadrupedi agli umanoidi 15:39 - Dietro le dimostrazioni dei robot 18:09 - Robot umanoidi in ambienti domestici 22:03 - Approccio all'addestramento 23:56 - Modelli VLA 27:59 - Chiudere il divario sim-to-real 32:55 - Orchestrazione dei compiti utilizzando VLM 36:38 - Uso degli strumenti 38:10 - Gerarchia del modello 43:37 - Simulatore contro ambiente di simulazione 44:57 - Combinare l'apprendimento per imitazione e l'apprendimento per rinforzo 46:42 - RL nel mondo reale rispetto a RL in simulazione 52:58 - Regolazione delle ricompense e funzioni di valore nella robotica 56:38 - Previsioni 1:00:10 - Umanoidi, quadrupedi e piattaforme su ruote 1:02:45 - Consigli, kit robot consigliati e comunità pla