Ізраїльська компанія Mentee Robotics продемонструвала логістичний робочий процес: два гуманоїди MenteeBot V3 працюють автономно, щоб підбирати та розміщувати контейнери. Модульна агентна система є бажаною, оскільки вона надає перевагу реальній надійності та меншим обчислювальним потребам порівняно з моделлю End-to-End VLA. Її архітектура складається з трьох компонентів: - LLM Planner: Перетворює інструкції у виконуваний код мови роботизованого API для надійної декомпозиції завдань і обробки помилок. - Стек сприйняття: використовує попередньо навчені моделі (NeRF/3DGS, дистильоване бачення) для розуміння сцени та навігації. - Політики керування: моделі навчання з підкріпленням (RL), навчені у масштабі через Sim2Real, генерують моторні команди, забезпечуючи високоточну мобільну маніпуляцію. Важливо, що робот вивчає нові завдання з однієї демонстрації за кілька годин. Відстеження об'єктів використовує 3D-геометрію (STL/URDF), відстежену у відео, для визначення функції винагороди RL. Навчання оптимізується за допомогою «Автоматичного навчання навчальної програми», яке автономно коригує складність завдань залежно від продуктивності робота, усуваючи ручну інженерію. Усі обчислення виконуються на борту.
Технічні характеристики апаратного забезпечення MenteeBot V3
8,06K