Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Plus de contexte ne signifie pas de meilleurs agents.
L'approche actuelle de la mémoire des agents est la lecture de transcriptions, où vous ajoutez chaque interaction passée à l'invite. Plus d'historique, plus d'informations, de meilleures décisions.
L'alternative est la mémoire basée sur la récupération, où vous stockez les interactions passées de manière externe et récupérez des artefacts pertinents à chaque tour.
Bien que cela soit efficace dans une certaine mesure, les deux approches échouent à mesure que les interactions s'étendent.
La lecture de transcriptions entraîne une croissance de contexte illimitée, réduit la sélectivité de l'attention et permet aux erreurs initiales de persister à travers une réexposition répétée.
La récupération optimise la similarité sémantique, pas la pertinence décisionnelle, et les erreurs de sélection se cumulent au fil des tours.
Ce nouvel article introduit le Compresseur Cognitif d'Agent (ACC), un contrôleur de mémoire inspiré de la biologie qui remplace la lecture de transcriptions par un état interne borné mis à jour en ligne à chaque tour.
Ce dont les agents ont besoin, ce n'est pas de plus de contexte, mais d'un meilleur contrôle de la mémoire.
L'ACC maintient un État Cognitif Comprimé (CCS), une représentation régie par un schéma contenant uniquement des variables critiques pour la décision : objectifs, contraintes, entités, relations et signaux d'incertitude.
À chaque tour, l'ACC rappelle des artefacts candidats, les filtre à travers une porte de qualification, et ne conserve que ce qui passe dans l'état suivant.
Il est crucial que l'ACC sépare le rappel d'artefacts de l'engagement d'état. Le contenu récupéré ne peut influencer l'état suivant que par le biais d'une compression contrainte par le schéma. Cela empêche le contenu non vérifié de devenir une mémoire persistante.
Au cours de 600 évaluations en direct (30 000 tours) couvrant les opérations informatiques, la réponse à la cybersécurité et les flux de travail en santé, l'ACC a maintenu une mémoire bornée tandis que la lecture de transcriptions croissait de manière linéaire. L'ACC a atteint des taux d'hallucination et de dérive proches de zéro au cours d'épisodes de 50 tours, tandis que les agents de base et de récupération ont montré des échecs croissants après des tours de stress.
L'agent de récupération a dû restreindre le rappel à seulement 3 artefacts par tour pour limiter l'escalade de la dérive. Même alors, les erreurs de sélection ont causé de l'instabilité.
Les échecs des agents multi-tours sont moins dus à un manque de connaissances qu'à un contrôle de mémoire faible. La compression cognitive fournit une base pratique pour des agents fiables à long terme.
Article :
...

Meilleurs
Classement
Favoris
