@k7agar 的 V-JEPA 2 世界模型的詳細分析 深入探討使其能夠以 65% 的成功率進行杯子抓取的架構 提到「語言目標問題」,即機器人能夠理解它需要達成的目標,而不需要被展示圖片 / 多張圖片 探索去中心化方法會很有趣 1. 世界模型生成「目標」的迭代 2. 去中心化驗證者網絡對哪一個被視為準確的「目標」進行投票,例如識別 BLT 三明治 以下是鏈接
624