Świetny artykuł na temat pamięci agentowej. Agenci LLM potrzebują zarówno pamięci długoterminowej, jak i krótkoterminowej, aby radzić sobie z złożonymi zadaniami. Jednak domyślne podejście dzisiaj traktuje te elementy jako oddzielne komponenty, z własnymi heurystykami, kontrolerami i strategiami optymalizacji. Ale pamięć to nie dwa niezależne systemy. To jeden proces poznawczy, który decyduje, co przechować, odzyskać, podsumować i zapomnieć. Te nowe badania wprowadzają AgeMem, zintegrowane ramy, które łączą zarządzanie pamięcią długoterminową i krótkoterminową bezpośrednio w polityce agenta poprzez działania oparte na narzędziach. Zamiast polegać na regułach opartych na wyzwalaczach lub pomocniczych menedżerach pamięci, agent uczy się, kiedy i jak wywoływać operacje pamięci: ADD, UPDATE, DELETE dla przechowywania długoterminowego oraz RETRIEVE, SUMMARY, FILTER dla zarządzania kontekstem. Używa trzyetapowej progresywnej strategii RL. Najpierw model uczy się przechowywania pamięci długoterminowej. Następnie opanowuje zarządzanie kontekstem krótkoterminowym. W końcu koordynuje oba aspekty w pełnych ustawieniach zadania. Aby poradzić sobie z fragmentarycznymi doświadczeniami z operacji pamięci, zaprojektowali krokowy GRPO (Group Relative Policy Optimization), który przekształca zależności między etapami w sygnały do nauczenia. Wyniki w pięciu benchmarkach długoterminowych: > Na Qwen2.5-7B, AgeMem osiąga średni wynik 41.96 w porównaniu do 37.14 dla Mem0, co stanowi 13% poprawy. > Na Qwen3-4B, różnica się powiększa: 54.31 vs 44.70. Dodanie pamięci długoterminowej samo w sobie przynosi zyski +10-14%. > Dodanie szkolenia RL przynosi dodatkowe +6%. > Pełny zintegrowany system z oboma typami pamięci osiąga do +21.7% poprawy w porównaniu do bazowych systemów bez pamięci. Zintegrowane zarządzanie pamięcią poprzez nauczalne działania oparte na narzędziach przewyższa fragmentaryczne heurystyczne procesy, umożliwiając agentom adaptacyjne podejmowanie decyzji, co zapamiętać, a co zapomnieć w zależności od wymagań zadania. Artykuł: ...