DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

J'ai découvert un moyen d'améliorer le pilotage des agents. En d'autres termes, comment améliorer les performances lorsque vous dites "assurez-vous de faire cela" et que le LLM ne le fait pas. Voici comment : Dire "n'oublie pas de faire X" est peu fiable - cela nécessite que l'agent LLM initie spontanément un comportement procédural. Mais présenter à l'agent une affirmation spécifique, peut-être incorrecte ("Vous devriez faire X - le faites-vous toujours ?") déclenche de manière fiable un comportement correctif lorsque l'affirmation est fausse. L'agent n'a pas besoin de se souvenir de vérifier. Le décalage entre l'état présenté et l'état réel crée un événement de correction auquel l'agent LLM répond naturellement. Cela me rappelle le vieil adage selon lequel "la meilleure façon d'obtenir une réponse correcte sur Internet est de poster une réponse incorrecte" et je suppose que cela a du sens puisque les LLM sont principalement la distillation de la "connaissance" d'Internet. Quoi qu'il en soit, j'ai construit un système de mémoire à long terme pour mes agents et l'implémenter de cette manière a résolu de nombreux problèmes.

Meilleurs

Classement

Favoris