Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
SARM — >uzun ufuk robot manipülasyonu için Aşamaya Duyarlı Ödül Modellemesi adlı yeni bir ödül modeli artık LeRobot'ta yer aldı! 🤗
Uzun ufuklu, temas açısından zengin manipülasyon (örneğin bir tişört katlamayı düşünün) karmaşıktır. Gösteriler doğal olarak tereddütler, düzeltmeler ve değişken kalite içerir. Klasik Davranış Klonlama (BC) her kareyi eşit şekilde ele alır, SARM ise daha akıllıca bir yaklaşım benimser.
🔎 Nasıl çalışıyor?
SARM, video tabanlı bir ödül modeli kullanarak şunları tahmin eder:
• mevcut görev aşaması
• o aşamada ince taneli ilerleme (0 → 1)
Bu, ilerleme iyileştirmesine dayalı verilerin yeniden tartılması yoluyla Ödül Hizalı Davranış Klonlamasını (RA-BC) mümkün kılar ve modelin ilerleme sağlayan yörüngeleri duranlardan ayırt etmesini sağlar.
Sol görsel: başarılı bir şekilde başlatma, ilerleme sorunsuz bir şekilde 0 → 1 artırıldı
Sağ görsel: başarısız dağıtım


👉 Şu anda LeRobot: Paper Project web sitesinde mevcut.
✨ Bu harika eserin orijinal yazarlarına teşekkürler: Qianzhong Chen @QianzhongChen, Justin Yu, Mac Schwager, Pieter Abbeel, Yide Shentu, Philipp Wu
895
En İyiler
Sıralama
Takip Listesi
