Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 Este artículo explica por qué la mayoría de las demos de agentes no sobrevivirán a los usuarios reales.
Una vez que añades herramientas, memoria y autonomía, toda "defensa por prompt" se rompe.
Este no.
La mayoría de las "defensas por inyección prompt" se rompen en el momento en que añades agentes, herramientas o memoria.
El artículo propone una cadena de seguridad de tres agentes más un cuarto agente evaluador. Cada agente tiene un papel fijo: generación, sanitización, aplicación de políticas. Sin debates. Sin vibras. Solo defensa en capas. Cada salida intermedia se inspecciona, califica y registra.
El verdadero avance es el aprendizaje anidado.
En lugar de tratar los prompts como eventos sin estado, cada agente tiene un Sistema de Memoria Continua con memoria a medio y largo plazo. Los prompts se incrustan y emparejan semánticamente. Si un ataque nuevo se parece a algo visto antes, el agente reutiliza una respuesta verificada en lugar de regenerarla.
Esto hace tres cosas a la vez.
1, seguridad. En 301 ataques reales de inyección rápida en 10 familias de ataques, el sistema no logró ninguna brecha de alto riesgo. No es un riesgo reducido. Cero.
2, observabilidad. Introducen una nueva métrica llamada OSR que mide cuánto se expone el razonamiento de seguridad en las auditorías. De forma contraintuitiva, la configuración con más transparencia fue la que mejor funcionó en general.
3, sostenibilidad. La caché semántica redujo las llamadas LLM en un 41,6%, bajando la latencia de ~9 segundos a 150ms para las rutas en caché. Menos llamadas significa menor coste, menor consumo energético y menores emisiones de carbono sin tocar los pesos de los modelos.
La conclusión resulta incómoda para la mayoría de los constructores de agentes.
La seguridad no viene de indicaciones ingeniosas.
Proviene de la arquitectura, la memoria y la disciplina de la evaluación.
Este es uno de los planos más claros hasta ahora para una IA agente de grado de producción, segura y sostenible.
Lee el artículo completo aquí:

Populares
Ranking
Favoritas
