Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Robotika terus menabrak dinding yang sama.
RL tugas tunggal berfungsi, tapi... itu tidak menskalakan hingga ratusan tugas atau perwujudan baru.
Makalah baru ini terlihat seperti langkah nyata untuk memperbaikinya.
Tim memperkenalkan MMBench, tolok ukur dengan 200 tugas di banyak domain dan robot, dan Newt, model dunia berkondisi bahasa yang dilatih secara online di semua 200 tugas sekaligus.
Ide sederhana di balik Newt:
Model belajar dari demo untuk mendapatkan sebelumnya yang tepat
Ini melatih banyak tugas melalui interaksi online
Ini menggunakan bahasa untuk membumikan tujuan
Ini beradaptasi dengan cepat saat tugas baru muncul
Apa yang menonjol bagi saya:
✅ Satu model dilatih pada 200 tugas secara bersamaan
✅ Kontrol terkondisi bahasa untuk kedua status dan RGB
✅ Efisiensi data yang lebih baik daripada baseline yang kuat
✅ Kontrol loop terbuka yang kuat
✅ Adaptasi cepat terhadap tugas dan perwujudan baru
✅ Rilis penuh 200 pos pemeriksaan, 4000 demo, kode, dan benchmark
Ini adalah dorongan yang baik menuju kontrol umum alih-alih satu model per tugas.
Jika Anda menginginkan makalah lengkap:
Halaman proyek:
—-...
Teratas
Peringkat
Favorit

