DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

🚨 Questo documento spiega perché la maggior parte delle dimostrazioni degli agenti non sopravvivrà agli utenti reali. Una volta aggiunti strumenti, memoria e autonomia, ogni "difesa contro i prompt" si rompe. Questa no. La maggior parte delle "difese contro l'iniezione di prompt" si rompe nel momento in cui si aggiungono agenti, strumenti o memoria. Il documento propone una pipeline di sicurezza a tre agenti più un quarto agente valutatore. Ogni agente ha un ruolo fisso: generazione, sanificazione, applicazione delle politiche. Niente dibattiti. Niente vibrazioni. Solo difesa stratificata. Ogni output intermedio viene ispezionato, valutato e registrato. La vera innovazione è l'Apprendimento Nascosto. Invece di trattare i prompt come eventi senza stato, ogni agente ha un Sistema di Memoria Continuo con memoria a medio e lungo termine. I prompt sono incorporati e abbinati semanticamente. Se un nuovo attacco assomiglia a qualcosa già visto, l'agente riutilizza una risposta verificata invece di rigenerarne una. Questo fa tre cose contemporaneamente. 1, sicurezza. In 301 attacchi reali di iniezione di prompt che coprono 10 famiglie di attacco, il sistema ha raggiunto zero violazioni ad alto rischio. Non rischio ridotto. Zero. 2, osservabilità. Introducono una nuova metrica chiamata OSR che misura quanto ragionamento sulla sicurezza è esposto per le verifiche. Controintuitivamente, la configurazione con la maggiore trasparenza ha ottenuto le migliori prestazioni complessive. 3, sostenibilità. La memorizzazione semantica ha ridotto le chiamate LLM del 41,6%, abbassando la latenza da ~9 secondi a 150 ms per i percorsi memorizzati. Meno chiamate significano costi inferiori, minore consumo energetico e minori emissioni di carbonio senza toccare i pesi del modello. Il messaggio è scomodo per la maggior parte dei costruttori di agenti. La sicurezza non deriva da prompt ingegnosi. Deriva dall'architettura, dalla memoria e dalla disciplina di valutazione. Questo è uno dei piani più chiari finora per un'IA agentica sicura, sostenibile e di qualità produttiva. Leggi il documento completo qui:

Principali

Ranking

Preferiti