🚀 介绍 SARM:用于长时间机器人操作的阶段感知奖励建模 机器人在处理像折叠皱巴巴的 T 恤这样的任务时遇到困难——这些任务时间长、接触丰富且难以标记。我们提出了一个可扩展的奖励建模框架来解决这个问题。 1/n