Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Công nghệ robot vẫn đang gặp phải những rào cản giống nhau.
Học tăng cường cho một nhiệm vụ hoạt động, nhưng... nó không thể mở rộng cho hàng trăm nhiệm vụ hoặc các hình thức mới.
Bài báo mới này trông như một bước tiến thực sự để khắc phục điều đó.
Nhóm nghiên cứu giới thiệu MMBench, một tiêu chuẩn với 200 nhiệm vụ trên nhiều lĩnh vực và robot, và Newt, một mô hình thế giới có điều kiện ngôn ngữ được đào tạo trực tuyến trên tất cả 200 nhiệm vụ cùng một lúc.
Ý tưởng đơn giản đằng sau Newt:
Mô hình học từ các bản demo để có được các ưu tiên đúng
Nó đào tạo qua nhiều nhiệm vụ thông qua tương tác trực tuyến
Nó sử dụng ngôn ngữ để định hướng mục tiêu
Nó thích ứng nhanh khi một nhiệm vụ mới xuất hiện
Những điều nổi bật với tôi:
✅ Một mô hình được đào tạo trên 200 nhiệm vụ cùng một lúc
✅ Kiểm soát có điều kiện ngôn ngữ cho cả trạng thái và RGB
✅ Hiệu quả dữ liệu tốt hơn so với các tiêu chuẩn mạnh
✅ Kiểm soát vòng mở mạnh mẽ
✅ Thích ứng nhanh với các nhiệm vụ và hình thức mới
✅ Phát hành đầy đủ 200 điểm kiểm tra, 4000 bản demo, mã nguồn và tiêu chuẩn
Đây là một bước tiến tốt hướng tới kiểm soát tổng quát thay vì một mô hình cho mỗi nhiệm vụ.
Nếu bạn muốn bài báo đầy đủ:
Trang dự án:
...
Hàng đầu
Thứ hạng
Yêu thích

