🚀 介紹 SARM:針對長期機器人操作的階段感知獎勵建模 機器人在處理像摺疊皺巴巴的 T 恤這樣的任務時遇到困難——這些任務長、接觸豐富且難以標記。我們提出了一個可擴展的獎勵建模框架來解決這個問題。 1/n