Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Jeg har snublet over en måte å forbedre agentstyring på. Nemlig hvordan man kan forbedre ytelsen når man sier «sørg for at du gjør dette» og LLM-en ikke gjør det. Her er den:
Å si «husk å gjøre X» er upålitelig – det krever at LLM-agenten spontant initierer en prosedyrehandling. Men å presentere agenten for en spesifikk, muligens feil påstand ("Du burde gjøre X – gjør du det fortsatt?") utløser pålitelig korrigerende atferd når påstanden er feil.
Agenten trenger ikke å huske å sjekke. Misforholdet mellom presentert tilstand og faktisk tilstand skaper en korrigeringshendelse som agentens LLM naturlig responderer på.
Dette minner meg om det gamle ordtaket om «den beste måten å få et riktig svar på internett er å poste et feil», og jeg antar det gir mening siden LLM-er hovedsakelig er den destillerte «kunnskapen» på internett.
Uansett, jeg har bygget et langvarig minnesystem for agentene mine, og å implementere det på denne måten løste mange problemer.
Topp
Rangering
Favoritter
