DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Ik ben op een manier gestuit om de sturing van agenten te verbeteren. Namelijk, hoe de prestaties te verbeteren wanneer je zegt "zorg ervoor dat je dit doet" en de LLM het niet doet. Hier is het: Zeggen "vergeet niet om X te doen" is onbetrouwbaar - het vereist dat de LLM-agent spontaan een procedureel gedrag initieert. Maar het presenteren van de agent met een specifieke, mogelijk onjuiste bewering ("Je zou X moeten doen - doe je het nog steeds?") activeert betrouwbaar corrigerend gedrag wanneer de bewering onjuist is. De agent hoeft niet te onthouden om te controleren. De mismatch tussen de gepresenteerde staat en de werkelijke staat creëert een correctie-evenement waar de agent LLM van nature op reageert. Dit doet me denken aan de oude maxime "de beste manier om een correct antwoord op het internet te krijgen, is door een verkeerd antwoord te posten" en ik denk dat dat logisch is, aangezien LLM's voornamelijk de gedistilleerde "kennis" van het internet zijn. Hoe dan ook, ik heb een langlopende geheugensysteem voor mijn agenten gebouwd en het op deze manier implementeren heeft veel problemen opgelost.

Boven

Positie

Favorieten