nous devons corriger l'architecture, le contexte de fenêtre glissante n'est pas la mémoire de l'agent 🧵
1/le contexte de la fenêtre glissante n'est pas la mémoire de l'agent. la plupart des gens qui construisent avec des agents IA ne connaissent pas la différence. et cela nuit à leurs produits.
Une fenêtre glissante est juste ce que le LLM peut voir en ce moment. (temporaire. sans état. aveugle en dehors de la fenêtre.) C'est la conversation active (tokens entrants, tokens sortants). Une fois que quelque chose défile au-delà de la limite, c'est fini. Complètement. Le modèle n'a aucune idée que cela a jamais existé.
La mémoire de l'agent est quelque chose de complètement différent. (c'est la différence entre la RAM et un disque dur.) C'est un stockage explicite (faits, préférences, interactions passées) qui vit en dehors du modèle. Il peut être interrogé, mis à jour, supprimé. Il survit à la fin des sessions.
4/sans mémoire réelle, les agents n'apprennent pas réellement des conversations passées. (c'est juste une hallucination très confiante.) ce qu'ils font à la place, c'est deviner. ils font des correspondances de motifs à l'intérieur de la fenêtre actuelle et simulent la continuité. cela semble cohérent. ce n'est pas.
5/Confondre les deux est là où les choses tournent mal silencieusement. Vous supposez que votre agent connaît les préférences de l'utilisateur. Il ne le fait pas (c'est juste le contexte déroulé il y a deux sessions). Il semblait se souvenir. Il travaillait simplement avec ce qui était devant lui.
votre agent n'est pas cassé. il n'a tout simplement jamais eu de mémoire pour commencer.
51