Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Hoje, estamos acompanhados por @rdn_nikita, cofundador e CEO da @FlexionRobotics, para discutir a diferença entre as capacidades robóticas atuais e o que é necessário para implantar robôs totalmente autônomos no mundo real. Nikita explica como o aprendizado por reforço e a simulação impulsionaram o rápido progresso na locomoção robótica — e por que a locomoção ainda está longe de estar "resolvida". Vamos analisar a lacuna do sim2real e como adicionar entradas visuais introduz ruído e complica significativamente a transferência de sim para real. Também exploramos o debate entre modelos de ponta a ponta e abordagens modulares, e por que separar locomoção, planejamento e semântica continua sendo uma abordagem pragmática hoje. Nikita também introduz o conceito de "real-para-simulação", que utiliza dados do mundo real para refinar parâmetros de simulação para treinamento de alta fidelidade, discute como aprendizado por reforço, aprendizado por imitação e dados de teleoperação são combinados para treinar políticas robustas tanto para robôs quadrúpedes quanto humanoides, e apresenta a abordagem hierárquica da Flexion que utiliza Modelos de Visão-Linguagem (VLMs) pré-treinados para orquestração de tarefas de alto nível com modelos Visão-Linguagem-Ação (VLA) e de baixo nível rastreadores para o corpo inteiro. Por fim, Nikita compartilha os bastidores das demonstrações de robôs humanoides, sua visão sobre aprendizado por reforço em simulação versus o mundo real, as nuances do ajuste de recompensas e oferece conselhos práticos para pesquisadores e profissionais que desejam começar na robótica hoje.
🗒️ Para a lista completa de recursos deste episódio, visite a página de notas do programa:
📖 CAPÍTULOS
===============================
00:00 - Introdução
04:07 - A locomoção robótica foi resolvida?
06:04 - Intervalo entre sim e real
08:58 - Adicionando semântica às políticas
09:42 - Arquiteturas modulares vs de ponta a ponta
10:29 - Modelo de planejador
12:21 - Adaptando técnicas de RL de quadrúpedes para humanoides
15:39 - Por trás das demonstrações de robôs
18:09 - Robôs humanóides em ambientes domésticos
22:03 - Aproximação do treinamento
23:56 - Modelos VLA
27:59 - Fechando a distância entre sim e real
32:55 - Orquestração de tarefas usando VLMs
36:38 - Uso de ferramentas
38:10 - Hierarquia de modelos
43:37 - Simulador versus ambiente de simulação
44:57 - Combinando aprendizado por imitação e aprendizado por reforço
46:42 - RL no mundo real versus RL na simulação
52:58 - Ajuste de recompensas e funções de valor em robótica
56:38 - Previsões
1:00:10 - Humanoides, quadrópedes e plataformas com rodas
1:02:45 - Conselhos, kits de robôs recomendados e pla comunitária
Melhores
Classificação
Favoritos
