🚨 Ce document explique pourquoi la plupart des démonstrations d'agents ne survivront pas aux utilisateurs réels. Une fois que vous ajoutez des outils, de la mémoire et de l'autonomie, chaque "défense contre les prompts" échoue. Celle-ci ne le fait pas. La plupart des "défenses contre l'injection de prompts" échouent dès que vous ajoutez des agents, des outils ou de la mémoire. Le document propose un pipeline de sécurité à trois agents plus un quatrième agent évaluateur. Chaque agent a un rôle fixe : génération, assainissement, application des politiques. Pas de débats. Pas de ressentis. Juste une défense en couches. Chaque sortie intermédiaire est inspectée, notée et enregistrée. La véritable avancée est l'Apprentissage Imbriqué. Au lieu de traiter les prompts comme des événements sans état, chaque agent dispose d'un Système de Mémoire Continuum avec une mémoire à moyen et long terme. Les prompts sont intégrés et appariés sémantiquement. Si une nouvelle attaque ressemble à quelque chose déjà vu, l'agent réutilise une réponse vérifiée au lieu d'en régénérer une. Cela fait trois choses à la fois. 1, sécurité. Sur 301 véritables attaques par injection de prompts couvrant 10 familles d'attaques, le système a atteint zéro violation à haut risque. Pas de risque réduit. Zéro. 2, observabilité. Ils introduisent une nouvelle métrique appelée OSR qui mesure combien de raisonnement de sécurité est exposé pour les audits. Contre-intuitivement, la configuration avec le plus de transparence a obtenu les meilleurs résultats globaux. 3, durabilité. Le cache sémantique a réduit les appels LLM de 41,6 %, faisant chuter la latence de ~9 secondes à 150 ms pour les chemins mis en cache. Moins d'appels signifie un coût plus bas, une consommation d'énergie réduite et des émissions de carbone plus faibles sans toucher aux poids du modèle. La conclusion est inconfortable pour la plupart des constructeurs d'agents. La sécurité ne vient pas de prompts astucieux. Elle vient de l'architecture, de la mémoire et de la discipline d'évaluation. C'est l'un des plans les plus clairs à ce jour pour une IA agentique sécurisée, durable et de qualité production. Lisez le document complet ici :