Hoje, estamos acompanhados por @rdn_nikita, co-fundador e CEO da @FlexionRobotics para discutir a lacuna entre as capacidades robóticas atuais e o que é necessário para implantar robôs totalmente autônomos no mundo real. Nikita explica como o aprendizado por reforço e a simulação impulsionaram o progresso rápido na locomoção de robôs — e por que a locomoção ainda está longe de ser "resolvida". Exploramos a lacuna sim2real e como a adição de entradas visuais introduz ruído e complica significativamente a transferência de sim para real. Também exploramos o debate entre modelos de ponta a ponta e abordagens modulares, e por que separar locomoção, planejamento e semântica continua a ser uma abordagem pragmática hoje. Nikita também introduz o conceito de "real-to-sim", que utiliza dados do mundo real para refinar parâmetros de simulação para um treinamento de maior fidelidade, discute como o aprendizado por reforço, o aprendizado por imitação e os dados de teleoperação são combinados para treinar políticas robustas para robôs quadrúpedes e humanoides, e apresenta a abordagem hierárquica da Flexion que utiliza Modelos de Linguagem-Visão (VLMs) pré-treinados para orquestração de tarefas de alto nível com modelos de Linguagem-Visão-Ação (VLA) e rastreadores de corpo inteiro de baixo nível. Finalmente, Nikita compartilha os bastidores das demonstrações de robôs humanoides, sua visão sobre o aprendizado por reforço em simulação versus o mundo real, as nuances do ajuste de recompensas e oferece conselhos práticos para pesquisadores e profissionais que desejam começar na robótica hoje. 🗒️ Para a lista completa de recursos deste episódio, visite a página de notas do programa: 📖 CAPÍTULOS =============================== 00:00 - Introdução 04:07 - A locomoção robótica está resolvida? 06:04 - Lacuna sim-para-real 08:58 - Adicionando semântica às políticas 09:42 - Arquiteturas modulares vs de ponta a ponta 10:29 - Modelo de planejador 12:21 - Adaptando técnicas de RL de quadrúpedes para humanoides 15:39 - Por trás das demonstrações de robôs 18:09 - Robôs humanoides em ambientes domésticos 22:03 - Abordagem de treinamento 23:56 - Modelos VLA 27:59 - Fechando a lacuna sim-para-real 32:55 - Orquestração de tarefas usando VLMs 36:38 - Uso de ferramentas 38:10 - Hierarquia de modelos 43:37 - Simulador versus ambiente de simulação 44:57 - Combinando aprendizado por imitação e aprendizado por reforço 46:42 - RL no mundo real versus RL em simulação 52:58 - Ajuste de recompensas e funções de valor em robótica 56:38 - Previsões 1:00:10 - Humanoides, quadrúpedes e plataformas com rodas 1:02:45 - Conselhos, kits de robôs recomendados e comunidade pla