Tento článek ukazuje, proč je škálování agentů s více ukázkami slepou uličkou. EvoCUA uvádí jednoduché, ale nepříjemné tvrzení: agenti používající počítače neselžou proto, že nejsou "dost chytří". Selhávají, protože jsou vycvičeni jako papoušci, ne jako studenti. Většina GUI agentů kopíruje statické stopy. To funguje na krátké úkoly. Zhroutí se ve chvíli, kdy potřebujete plánování, zotavení nebo úsudek. EvoCUA převrací paradigma ze škálování dat na škálování zážitků. Místo sbírání dalších screenshotů a skriptů vytváří uzavřenou smyčku: • automaticky syntetizují úlohy • připojit spustitelné validátory (bez vágních odměn) • spouštějí masivní paralelní sandbox rollouty • porovnání trajektorií úspěchu a neúspěchu • posilovat to, co funguje, přepsat to, co se rozbíjí Selhání tady není hluk. Jsou to signály s nejvyšší hodnotou. Model se naučí, kde došlo k chybě, proč a jak ji opravit, a pak si tuto opravu internalizuje. To je důležité, protože GUI agenti umírají na hranicích: neočekávané stavy UI Dlouhodobé pracovní postupy Chyby v načasování, objednávání a obnově ...