rozpad světového modelu V-JEPA 2 podle @k7agar Ponořit se do architektury, která mu umožnila provádět uchopování kelímků s 65% úspěšností zmiňuje se o "problému jazykového cíle", kdy je robot schopen pochopit, čeho musí dosáhnout, aniž by mu byl zobrazen obrázek / více obrázků Bylo by zajímavé prozkoumat k tomu decentralizovaný přístup 1. World Model generuje iterace "cíle" 2. decentralizovaná síť ověřovatelů hlasuje, který z nich je považován za přesný "cíl", např. identifikace sendviče BLT odkaz níže
520