トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 この論文が、ほとんどのエージェントデモが実際のユーザーには耐えられない理由です。
ツールやメモリ、自律性を加えると、すべての「プロンプト防御」は壊れます。
この作品はそうではありません。
ほとんどの「プロンプトインジェクション防御」は、エージェントやツール、メモリを追加した瞬間に破られます。
論文は3人のエージェントと4人の評価エージェントを提案しています。各エージェントには固定された役割があります:生成、サニティ、ポリシーの執行。議論はなし。全然気分がなかった。ただの多層防御です。すべての中間出力は検査され、評価され、記録されます。
本当の突破口はネスト学習です。
プロンプトをステートレスイベントとして扱うのではなく、各エージェントは中長期記憶を持つ連続記憶システムを持っています。プロンプトは埋め込まれ、意味的にマッチングされます。新しい攻撃が以前に見たものに似ている場合、エージェントは再生成ではなく検証済みの応答を再利用します。
これは同時に三つのことをします。
1、セキュリティ。10の攻撃ファミリーにわたる301件の実際のプロンプトインジェクション攻撃において、システムは高リスクの侵害を一切達成していません。リスクの軽減ではありません。ゼロ。
2、観測可能性。監査でどれだけセキュリティの理由が露出するかを測る新しい指標「OSR」を導入しました。逆説的に、最も透明性の高い構成が全体的に最も良いパフォーマンスを示しました。
3、持続可能性。セマンティックキャッシュによりLLM呼び出しは41.6%削減され、キャッシュパスの遅延は~9秒から150msに短縮されました。通話回数が少なければ、モデルの重量に触れずにコスト、エネルギー消費、炭素排出量の削減が実現します。
この結論は、多くのエージェントビルダーにとって居心地の悪いものです。
セキュリティは巧妙なプロンプトから生まれるものではありません。
それは建築、記憶、評価の規律から生まれます。
これは、生産レベルで安全かつ持続可能なエージェントAIの設計図の中でも最も明確なものの一つです。
全文はこちらからお読みください:

トップ
ランキング
お気に入り
