Izraelská společnost Mentee Robotics předvedla logistický postup: dva humanoidi MenteeBot V3 pracují autonomně při vyzvedávání a umisťování boxů. Modulární agentní systém je preferován, protože upřednostňuje reálnou robustnost a nižší výpočetní nároky oproti modelu End-to-End VLA. Jeho architektura se skládá ze tří částí: - LLM Planner: Převádí instrukce do spustitelného kódu Robotic API Language pro spolehlivou dekompozici úloh a zpracování chyb. - Perception Stack: Používá předtrénované modely (NeRF/3DGS, destilované vidění) pro porozumění scénám a navigaci. - Řídicí politiky: Modely posilovaného učení (RL), trénované ve velkém měřítku pomocí Sim2Real, generují motorické příkazy a umožňují vysoce přesnou mobilní manipulaci. Klíčové je, že robot se během několika hodin naučí nové úkoly z jedné ukázky. Sledování objektů využívá 3D geometrii (STL/URDF) sledovanou ve videu k definování funkce odměny RL. Školení je optimalizováno pomocí 'automatického učení kurikula', které autonomně upravuje obtížnost úkolů na základě výkonu robota a eliminuje manuální inženýrství. Veškeré výpočty běží přímo na palubě.
Specifikace hardwaru MenteeBot V3
8,04K