以色列的 Mentee Robotics 展示了一個物流工作流程:兩個 MenteeBot V3 人形機器人自主工作,進行物品的拾取和放置。 模組化代理系統是首選,因為它在現實世界的穩健性和較低的計算需求上優於端到端的 VLA 模型。其架構由三個組件組成: - LLM 計劃者:將指令轉換為可執行的機器人 API 語言代碼,以實現可靠的任務分解和錯誤處理。 - 感知堆疊:使用預訓練模型(NeRF/3DGS,精煉視覺)進行場景理解和導航。 - 控制策略:強化學習(RL)模型,通過 Sim2Real 大規模訓練,生成馬達指令,實現高精度的移動操作。 關鍵是,機器人能在幾小時內從單一示範中學習新任務。物體追蹤使用 3D 幾何(STL/URDF)在視頻中進行追蹤,以定義 RL 獎勵函數。 訓練使用「自動課程學習」進行優化,該系統根據機器人的表現自動調整任務難度,消除了手動工程的需求。所有計算均在機器人上進行。
MenteeBot V3 硬體規格
8.81K