DApp Mağazası | Etkinlikler ve Oyunlar için Web3 Merkezi

Trend Olan Konular

SARM — >uzun ufuk robot manipülasyonu için Aşamaya Duyarlı Ödül Modellemesi adlı yeni bir ödül modeli artık LeRobot'ta yer aldı! 🤗 Uzun ufuklu, temas açısından zengin manipülasyon (örneğin bir tişört katlamayı düşünün) karmaşıktır. Gösteriler doğal olarak tereddütler, düzeltmeler ve değişken kalite içerir. Klasik Davranış Klonlama (BC) her kareyi eşit şekilde ele alır, SARM ise daha akıllıca bir yaklaşım benimser. 🔎 Nasıl çalışıyor? SARM, video tabanlı bir ödül modeli kullanarak şunları tahmin eder: • mevcut görev aşaması • o aşamada ince taneli ilerleme (0 → 1) Bu, ilerleme iyileştirmesine dayalı verilerin yeniden tartılması yoluyla Ödül Hizalı Davranış Klonlamasını (RA-BC) mümkün kılar ve modelin ilerleme sağlayan yörüngeleri duranlardan ayırt etmesini sağlar. Sol görsel: başarılı bir şekilde başlatma, ilerleme sorunsuz bir şekilde 0 → 1 artırıldı Sağ görsel: başarısız dağıtım

👉 Şu anda LeRobot: Paper Project web sitesinde mevcut. ✨ Bu harika eserin orijinal yazarlarına teşekkürler: Qianzhong Chen @QianzhongChen, Justin Yu, Mac Schwager, Pieter Abbeel, Yide Shentu, Philipp Wu

895

En İyiler

Sıralama

Takip Listesi