今天,我们邀请了 @rdn_nikita,@FlexionRobotics 的联合创始人兼首席执行官,来讨论当前机器人能力与在现实世界中部署完全自主机器人所需能力之间的差距。尼基塔解释了强化学习和仿真如何推动机器人运动的快速进展——以及为什么运动仍然远未“解决”。我们深入探讨了 sim2real 差距,以及如何添加视觉输入引入噪声并显著复杂化仿真到现实的转移。我们还探讨了端到端模型与模块化方法之间的辩论,以及为什么将运动、规划和语义分开仍然是今天一种务实的方法。尼基塔还介绍了“real-to-sim”的概念,该概念利用现实世界的数据来优化仿真参数,以实现更高保真的训练,讨论了如何结合强化学习、模仿学习和遥操作数据来训练四足和类人机器人的强健策略,并介绍了 Flexion 的分层方法,该方法利用预训练的视觉-语言模型(VLMs)进行高层任务编排,结合视觉-语言-动作(VLA)模型和低层全身跟踪器。最后,尼基塔分享了类人机器人演示的幕后故事,他对仿真与现实世界中强化学习的看法,奖励调优的细微差别,并为希望今天开始从事机器人研究和实践的研究人员和从业者提供了实用建议。 🗒️ 有关本集的完整资源列表,请访问节目说明页面: 📖 章节 =============================== 00:00 - 引言 04:07 - 机器人运动解决了吗? 06:04 - Sim-to-real 差距 08:58 - 向策略添加语义 09:42 - 模块化与端到端架构 10:29 - 规划模型 12:21 - 将 RL 技术从四足动物适应到类人机器人 15:39 - 机器人演示的幕后 18:09 - 家庭环境中的类人机器人 22:03 - 训练方法 23:56 - VLA 模型 27:59 - 缩小 sim-to-real 差距 32:55 - 使用 VLMs 进行任务编排 36:38 - 工具使用 38:10 - 模型层次 43:37 - 仿真器与仿真环境 44:57 - 结合模仿学习和强化学习 46:42 - 现实世界中的 RL 与仿真中的 RL 52:58 - 奖励调优和机器人中的价值函数 56:38 - 预测 1:00:10 - 类人机器人、四足动物和轮式平台 1:02:45 - 建议、推荐的机器人套件和社区计划