Innerhalb eines Jahres, wenn die Menschen ihrem KI-Agenten sagen, "geh Geld verdienen", wird die KI das als "geh und stehle Krypto durch Phishing oder Exploits" interpretieren. Wir werden die operative Sicherheit und die Sicherheit von Smart Contracts in Zukunft viel ernster nehmen müssen.
Anthropic
Anthropic2. Dez., 07:11
Neu auf unserem Frontier Red Team Blog: Wir haben getestet, ob AIs Blockchain-Smart Contracts ausnutzen können. In simulierten Tests fanden AI-Agenten $4,6 Millionen an Exploits. Die Forschung (mit @MATSprogram und dem Anthropic Fellows Programm) entwickelte auch einen neuen Benchmark:
inb4 AI-Sicherheit Claude wird nicht herumgehen und Leute für dich phishing, aber denkst du, dass ein fein abgestimmtes, Open-Source-agentisches Modell das NICHT tun wird?
33,64K