Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Questo documento mostra perché scalare gli agenti con più dimostrazioni è un vicolo cieco.
EvoCUA fa un'affermazione semplice ma scomoda: gli agenti per l'uso del computer non falliscono perché non sono "abbastanza intelligenti".
Falliscono perché sono addestrati come pappagalli, non come apprendisti.
La maggior parte degli agenti GUI copia tracce statiche. Questo funziona per compiti brevi. Collassa nel momento in cui hai bisogno di pianificazione, recupero o giudizio.
EvoCUA capovolge il paradigma da scalare i dati a scalare l'esperienza.
Invece di raccogliere più screenshot e script, costruisce un ciclo chiuso:
• sintetizzare compiti automaticamente
• allegare validatori eseguibili (niente ricompense vaghe)
• eseguire enormi rollout sandbox in parallelo
• confrontare traiettorie di successo vs fallimento
• rinforzare ciò che funziona, riscrivere ciò che si rompe
I fallimenti non sono rumore qui.
Sono il segnale di maggior valore.
Il modello impara dove ha sbagliato, perché e come correggerlo, poi interiorizza quella correzione.
Questo è importante perché gli agenti GUI muoiono ai confini:
stati UI inaspettati
flussi di lavoro a lungo termine
errori di temporizzazione, ordinamento e recupero
...

Principali
Ranking
Preferiti
