Sklep DApp | Centrum Web3 dla wydarzeń i gier

Popularne tematy

Więcej kontekstu nie oznacza lepszych agentów. Obecne podejście do pamięci agentów polega na odtwarzaniu transkryptów, gdzie do podpowiedzi dodaje się każdą wcześniejszą interakcję. Więcej historii, więcej informacji, lepsze decyzje. Alternatywą jest pamięć oparta na wyszukiwaniu, gdzie przechowujesz wcześniejsze interakcje zewnętrznie i przywołujesz odpowiednie artefakty w każdej turze. Chociaż skuteczne do pewnego stopnia, oba podejścia zawodzą, gdy interakcje się wydłużają. Odtwarzanie transkryptów powoduje nieograniczony wzrost kontekstu, zmniejsza selektywność uwagi i pozwala na utrzymywanie wczesnych błędów przez powtarzające się narażenie. Wyszukiwanie optymalizuje pod kątem podobieństwa semantycznego, a nie istotności decyzji, a błędy w selekcji kumulują się w kolejnych turach. Ten nowy artykuł wprowadza Agent Cognitive Compressor (ACC), kontroler pamięci inspirowany biologią, który zastępuje odtwarzanie transkryptów ograniczonym stanem wewnętrznym aktualizowanym online w każdej turze. To, czego potrzebują agenci, to nie więcej kontekstu, ale lepsza kontrola pamięci. ACC utrzymuje Skondensowany Stan Poznawczy (CCS), reprezentację rządzoną przez schemat, zawierającą tylko krytyczne dla decyzji zmienne: cele, ograniczenia, podmioty, relacje i sygnały niepewności. W każdej turze ACC przypomina sobie kandydatów na artefakty, filtruje je przez bramkę kwalifikacyjną i zatwierdza tylko to, co przechodzi do następnego stanu. Kluczowe jest to, że ACC oddziela przypomnienie artefaktów od zobowiązania do stanu. Przywołana treść może wpływać na następny stan tylko poprzez kompresję ograniczoną schematem. Zapobiega to temu, aby niezweryfikowana treść stała się pamięcią trwałą. W ciągu 600 ocen na żywo (30 000 tur) obejmujących operacje IT, odpowiedzi na cyberbezpieczeństwo i przepływy pracy w opiece zdrowotnej, ACC utrzymywał ograniczoną pamięć, podczas gdy odtwarzanie transkryptów rosło liniowo. ACC osiągnął niemal zerowe wskaźniki halucynacji i dryfu w 50-turowych epizodach, podczas gdy agenci bazowi i wyszukiwawczy wykazywali rosnące niepowodzenia po turach stresowych. Agent wyszukiwawczy wymagał ograniczenia przypomnienia do zaledwie 3 artefaktów na turę, aby ograniczyć eskalację dryfu. Nawet wtedy błędy w selekcji powodowały niestabilność. Niepowodzenia agentów w wielu turach są mniej spowodowane brakiem wiedzy, a bardziej słabą kontrolą pamięci. Kompresja poznawcza stanowi praktyczną podstawę dla niezawodnych agentów długoterminowych. Artykuł: ...

Najlepsze

Ranking

Ulubione