Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Tento článek ukazuje, proč je škálování agentů s více ukázkami slepou uličkou.
EvoCUA uvádí jednoduché, ale nepříjemné tvrzení: agenti používající počítače neselžou proto, že nejsou "dost chytří".
Selhávají, protože jsou vycvičeni jako papoušci, ne jako studenti.
Většina GUI agentů kopíruje statické stopy. To funguje na krátké úkoly. Zhroutí se ve chvíli, kdy potřebujete plánování, zotavení nebo úsudek.
EvoCUA převrací paradigma ze škálování dat na škálování zážitků.
Místo sbírání dalších screenshotů a skriptů vytváří uzavřenou smyčku:
• automaticky syntetizují úlohy
• připojit spustitelné validátory (bez vágních odměn)
• spouštějí masivní paralelní sandbox rollouty
• porovnání trajektorií úspěchu a neúspěchu
• posilovat to, co funguje, přepsat to, co se rozbíjí
Selhání tady není hluk.
Jsou to signály s nejvyšší hodnotou.
Model se naučí, kde došlo k chybě, proč a jak ji opravit, a pak si tuto opravu internalizuje.
To je důležité, protože GUI agenti umírají na hranicích:
neočekávané stavy UI
Dlouhodobé pracovní postupy
Chyby v načasování, objednávání a obnově
...

Top
Hodnocení
Oblíbené
