Internetul este o sală de clasă slabă pentru instruirea agenților web. Fiecare click pe un site live costă timp și riscă o interdicție. Această lucrare de cercetare indică o cale diferită prin antrenarea agenților pe o versiune visată a web-ului. Folosește un model predictor pentru a învăța cum răspund site-urile la acțiuni precum apăsarea pe butoane sau trimiterea formularelor. Apoi agentul rulează în minte sesiuni de răsfoire pentru a exersa. Această repetiție are loc fără să atingă un loc real... Și pare să se traducă în performanțe mai bune odată ce agentul devine activ. Datele de la Dynaweb arată o îmbunătățire relativă de 16% față de Webarena și noile rezultate SOTA pe WebVoyager. Vom vedea simulatoare specifice domeniului pentru fiecare instrument major de întreprindere? Link: Arxiv. org/pdf/2601.22149v1