Hoje, estamos acompanhados por @rdn_nikita, cofundador e CEO da @FlexionRobotics, para discutir a diferença entre as capacidades robóticas atuais e o que é necessário para implantar robôs totalmente autônomos no mundo real. Nikita explica como o aprendizado por reforço e a simulação impulsionaram o rápido progresso na locomoção robótica — e por que a locomoção ainda está longe de estar "resolvida". Vamos analisar a lacuna do sim2real e como adicionar entradas visuais introduz ruído e complica significativamente a transferência de sim para real. Também exploramos o debate entre modelos de ponta a ponta e abordagens modulares, e por que separar locomoção, planejamento e semântica continua sendo uma abordagem pragmática hoje. Nikita também introduz o conceito de "real-para-simulação", que utiliza dados do mundo real para refinar parâmetros de simulação para treinamento de alta fidelidade, discute como aprendizado por reforço, aprendizado por imitação e dados de teleoperação são combinados para treinar políticas robustas tanto para robôs quadrúpedes quanto humanoides, e apresenta a abordagem hierárquica da Flexion que utiliza Modelos de Visão-Linguagem (VLMs) pré-treinados para orquestração de tarefas de alto nível com modelos Visão-Linguagem-Ação (VLA) e de baixo nível rastreadores para o corpo inteiro. Por fim, Nikita compartilha os bastidores das demonstrações de robôs humanoides, sua visão sobre aprendizado por reforço em simulação versus o mundo real, as nuances do ajuste de recompensas e oferece conselhos práticos para pesquisadores e profissionais que desejam começar na robótica hoje. 🗒️ Para a lista completa de recursos deste episódio, visite a página de notas do programa: 📖 CAPÍTULOS =============================== 00:00 - Introdução 04:07 - A locomoção robótica foi resolvida? 06:04 - Intervalo entre sim e real 08:58 - Adicionando semântica às políticas 09:42 - Arquiteturas modulares vs de ponta a ponta 10:29 - Modelo de planejador 12:21 - Adaptando técnicas de RL de quadrúpedes para humanoides 15:39 - Por trás das demonstrações de robôs 18:09 - Robôs humanóides em ambientes domésticos 22:03 - Aproximação do treinamento 23:56 - Modelos VLA 27:59 - Fechando a distância entre sim e real 32:55 - Orquestração de tarefas usando VLMs 36:38 - Uso de ferramentas 38:10 - Hierarquia de modelos 43:37 - Simulador versus ambiente de simulação 44:57 - Combinando aprendizado por imitação e aprendizado por reforço 46:42 - RL no mundo real versus RL na simulação 52:58 - Ajuste de recompensas e funções de valor em robótica 56:38 - Previsões 1:00:10 - Humanoides, quadrópedes e plataformas com rodas 1:02:45 - Conselhos, kits de robôs recomendados e pla comunitária