Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 Această lucrare explică motivul pentru care majoritatea demo-urilor agenților nu vor supraviețui utilizatorilor reali.
Odată ce adaugi unelte, memorie și autonomie, fiecare "apărare promptă" se strică.
Acesta nu.
Majoritatea "apărării prin injecție promptă" se strică în momentul în care adaugi agenți, unelte sau memorie.
Lucrarea propune un pipeline de securitate format din trei agenți plus un al patrulea agent evaluator. Fiecare agent are un rol fix: generare, igienizare, aplicarea politicilor. Fără dezbateri. Fără vibrații. Doar apărare stratificată. Fiecare ieșire intermediară este inspectată, notată și înregistrată.
Adevărata descoperire este Învățarea Imbricată.
În loc să trateze prompturile ca evenimente fără stare, fiecare agent are un Sistem de Memorie Continuă cu memorie pe termen mediu și lung. Prompturile sunt încorporate și potrivite semantic. Dacă un atac nou seamănă cu ceva văzut anterior, agentul reutilizează un răspuns verificat în loc să-l regenereze.
Asta face trei lucruri simultan.
1, securitatea. Pe parcursul a 301 atacuri reale de injecție promptă pe 10 familii de atacuri, sistemul nu a realizat nicio breșă cu risc ridicat. Nu risc redus. Zero.
2, observabilitate. Ei introduc un nou indicator numit OSR care măsoară cât de mult este expus raționamentul de securitate pentru audituri. Contrar intuiției, configurația cu cea mai mare transparență a avut cele mai bune rezultate per ansamblu.
3, sustenabilitate. Cache-ul semantic a redus apelurile LLM cu 41,6%, scăzând latența de la ~9 secunde la 150ms pentru căile cache. Mai puține apeluri înseamnă costuri mai mici, consum mai redus de energie și emisii mai mici de carbon fără a atinge greutățile modelului.
Concluzia este incomodă pentru majoritatea constructorilor de agenți.
Securitatea nu vine din prompturi ingenioase.
Aceasta provine din arhitectură, memorie și disciplina evaluării.
Acesta este unul dintre cele mai clare planuri de până acum pentru AI agentic de calitate de producție, sigură și sustenabilă.
Citește lucrarea completă aici:

Limită superioară
Clasament
Favorite
