Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 Este documento es la razón por la que la mayoría de las demostraciones de agentes no sobrevivirán a usuarios reales.
Una vez que añades herramientas, memoria y autonomía, cada "defensa contra prompts" se rompe.
Esta no.
La mayoría de las "defensas contra inyecciones de prompts" se rompen en el momento en que añades agentes, herramientas o memoria.
El documento propone un pipeline de seguridad de tres agentes más un cuarto agente evaluador. Cada agente tiene un rol fijo: generación, saneamiento, aplicación de políticas. Sin debates. Sin vibras. Solo defensa en capas. Cada salida intermedia es inspeccionada, evaluada y registrada.
El verdadero avance es el Aprendizaje Anidado.
En lugar de tratar los prompts como eventos sin estado, cada agente tiene un Sistema de Memoria Continuo con memoria a medio y largo plazo. Los prompts están incrustados y se emparejan semánticamente. Si un nuevo ataque se parece a algo visto antes, el agente reutiliza una respuesta verificada en lugar de regenerar una.
Esto hace tres cosas a la vez.
1, seguridad. A través de 301 ataques reales de inyección de prompts que abarcan 10 familias de ataques, el sistema logró cero brechas de alto riesgo. No riesgo reducido. Cero.
2, observabilidad. Introducen una nueva métrica llamada OSR que mide cuánto razonamiento de seguridad se expone para auditorías. Contrariamente a la intuición, la configuración con más transparencia tuvo el mejor rendimiento en general.
3, sostenibilidad. La caché semántica redujo las llamadas a LLM en un 41.6%, disminuyendo la latencia de ~9 segundos a 150 ms para rutas en caché. Menos llamadas significa menor costo, menor uso de energía y menores emisiones de carbono sin tocar los pesos del modelo.
La conclusión es incómoda para la mayoría de los constructores de agentes.
La seguridad no proviene de prompts ingeniosos.
Proviene de la arquitectura, la memoria y la disciplina de evaluación.
Este es uno de los planos más claros hasta ahora para una IA agente segura, sostenible y de calidad de producción.
Lee el documento completo aquí:

Parte superior
Clasificación
Favoritos
