Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Świetny artykuł na temat pamięci agentowej.
Agenci LLM potrzebują zarówno pamięci długoterminowej, jak i krótkoterminowej, aby radzić sobie z złożonymi zadaniami.
Jednak domyślne podejście dzisiaj traktuje te elementy jako oddzielne komponenty, z własnymi heurystykami, kontrolerami i strategiami optymalizacji.
Ale pamięć to nie dwa niezależne systemy. To jeden proces poznawczy, który decyduje, co przechować, odzyskać, podsumować i zapomnieć.
Te nowe badania wprowadzają AgeMem, zintegrowane ramy, które łączą zarządzanie pamięcią długoterminową i krótkoterminową bezpośrednio w polityce agenta poprzez działania oparte na narzędziach.
Zamiast polegać na regułach opartych na wyzwalaczach lub pomocniczych menedżerach pamięci, agent uczy się, kiedy i jak wywoływać operacje pamięci: ADD, UPDATE, DELETE dla przechowywania długoterminowego oraz RETRIEVE, SUMMARY, FILTER dla zarządzania kontekstem.
Używa trzyetapowej progresywnej strategii RL. Najpierw model uczy się przechowywania pamięci długoterminowej. Następnie opanowuje zarządzanie kontekstem krótkoterminowym. W końcu koordynuje oba aspekty w pełnych ustawieniach zadania.
Aby poradzić sobie z fragmentarycznymi doświadczeniami z operacji pamięci, zaprojektowali krokowy GRPO (Group Relative Policy Optimization), który przekształca zależności między etapami w sygnały do nauczenia.
Wyniki w pięciu benchmarkach długoterminowych:
> Na Qwen2.5-7B, AgeMem osiąga średni wynik 41.96 w porównaniu do 37.14 dla Mem0, co stanowi 13% poprawy.
> Na Qwen3-4B, różnica się powiększa: 54.31 vs 44.70. Dodanie pamięci długoterminowej samo w sobie przynosi zyski +10-14%.
> Dodanie szkolenia RL przynosi dodatkowe +6%.
> Pełny zintegrowany system z oboma typami pamięci osiąga do +21.7% poprawy w porównaniu do bazowych systemów bez pamięci.
Zintegrowane zarządzanie pamięcią poprzez nauczalne działania oparte na narzędziach przewyższa fragmentaryczne heurystyczne procesy, umożliwiając agentom adaptacyjne podejmowanie decyzji, co zapamiętać, a co zapomnieć w zależności od wymagań zadania.
Artykuł:
...

Najlepsze
Ranking
Ulubione
