Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 Dieses Papier erklärt, warum die meisten Agenten-Demos bei echten Nutzern nicht bestehen werden.
Sobald Sie Werkzeuge, Gedächtnis und Autonomie hinzufügen, bricht jede "Prompt-Abwehr" zusammen.
Diese hier nicht.
Die meisten "Prompt-Injektionsabwehrmaßnahmen" brechen in dem Moment, in dem Sie Agenten, Werkzeuge oder Gedächtnis hinzufügen.
Das Papier schlägt eine Sicherheitspipeline mit drei Agenten plus einem vierten Evaluierungsagenten vor. Jeder Agent hat eine feste Rolle: Generierung, Sanitierung, Durchsetzung von Richtlinien. Keine Debatten. Keine Vibes. Nur geschichtete Verteidigung. Jede Zwischenausgabe wird inspiziert, bewertet und protokolliert.
Der echte Durchbruch ist Nested Learning.
Anstatt Eingabeaufforderungen als zustandslose Ereignisse zu behandeln, hat jeder Agent ein Kontinuum-Gedächtnissystem mit mittelfristigem und langfristigem Gedächtnis. Eingabeaufforderungen werden eingebettet und semantisch abgeglichen. Wenn ein neuer Angriff wie etwas aussieht, das zuvor gesehen wurde, verwendet der Agent eine verifizierte Antwort, anstatt eine neue zu regenerieren.
Das macht drei Dinge auf einmal.
1, Sicherheit. Bei 301 realen Prompt-Injektionsangriffen, die 10 Angriffsfamilien umspannen, erreichte das System null hochriskante Verstöße. Kein reduziertes Risiko. Null.
2, Beobachtbarkeit. Sie führen eine neue Metrik namens OSR ein, die misst, wie viel Sicherheitsüberlegungen für Audits offengelegt werden. Gegenintuitiv hat die Konfiguration mit der meisten Transparenz insgesamt am besten abgeschnitten.
3, Nachhaltigkeit. Semantisches Caching reduzierte die LLM-Anfragen um 41,6 %, wodurch die Latenz von ~9 Sekunden auf 150 ms für zwischengespeicherte Pfade fiel. Weniger Anfragen bedeuten geringere Kosten, geringeren Energieverbrauch und geringere Kohlenstoffemissionen, ohne die Modellgewichte zu berühren.
Die Erkenntnis ist für die meisten Agentenbauer unangenehm.
Sicherheit kommt nicht von cleveren Eingabeaufforderungen.
Sie kommt von Architektur, Gedächtnis und Evaluierungsdisziplin.
Dies ist einer der klarsten Pläne für produktionsreife, sichere und nachhaltige agentische KI.
Lesen Sie das vollständige Papier hier:

Top
Ranking
Favoriten
