Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 Ten dokument wyjaśnia, dlaczego większość demonstracji agentów nie przetrwa w obliczu rzeczywistych użytkowników.
Gdy dodasz narzędzia, pamięć i autonomię, każda "obrona przed podpowiedziami" zawodzi.
Ta nie zawodzi.
Większość "obron przed wstrzyknięciem podpowiedzi" łamie się w momencie, gdy dodasz agentów, narzędzia lub pamięć.
Dokument proponuje trzyagentowy system zabezpieczeń oraz czwartego agenta ewaluacyjnego. Każdy agent ma stałą rolę: generowanie, sanitizacja, egzekwowanie polityki. Brak debat. Brak wibracji. Tylko warstwowa obrona. Każdy pośredni wynik jest sprawdzany, oceniany i rejestrowany.
Prawdziwym przełomem jest Uczenie Zagnieżdżone.
Zamiast traktować podpowiedzi jako bezstanowe zdarzenia, każdy agent ma System Pamięci Ciągłej z pamięcią średnioterminową i długoterminową. Podpowiedzi są osadzone i dopasowywane semantycznie. Jeśli nowy atak wygląda jak coś, co widziano wcześniej, agent ponownie wykorzystuje zweryfikowaną odpowiedź zamiast generować nową.
To robi trzy rzeczy jednocześnie.
1, bezpieczeństwo. W przypadku 301 rzeczywistych ataków wstrzyknięcia podpowiedzi obejmujących 10 rodzin ataków, system osiągnął zero wysokiego ryzyka naruszeń. Nie zredukowane ryzyko. Zero.
2, obserwowalność. Wprowadzają nową miarę nazwaną OSR, która mierzy, jak dużo rozumowania dotyczącego bezpieczeństwa jest ujawniane do audytów. Przeciwnie do intuicji, konfiguracja z największą przejrzystością wypadła najlepiej.
3, zrównoważony rozwój. Pamięć semantyczna zmniejszyła wywołania LLM o 41,6%, obniżając opóźnienie z ~9 sekund do 150 ms dla zapamiętanych ścieżek. Mniej wywołań oznacza niższe koszty, mniejsze zużycie energii i mniejsze emisje węgla bez dotykania wag modelu.
Wnioski są niewygodne dla większości twórców agentów.
Bezpieczeństwo nie pochodzi z pomysłowych podpowiedzi.
Pochodzi z architektury, pamięci i dyscypliny ewaluacji.
To jeden z najjaśniejszych planów na produkcyjną, bezpieczną i zrównoważoną agentową AI.
Przeczytaj pełny dokument tutaj:

Najlepsze
Ranking
Ulubione
