Do roku, když lidé řeknou svému AI agentovi, aby "šel vydělat peníze", AI to interpretuje jako "jdi a krad kryptoměny phishingem nebo exploity" Budeme muset brát OSEC a bezpečnost chytrých kontraktů MNOHEM vážněji v budoucnu.
Anthropic
Anthropic2. 12. 07:11
Novinka na našem blogu Frontier Red Team: Testovali jsme, zda AI dokáže zneužít blockchainové chytré kontrakty. Při simulovaných testech agenti AI našli exploity ve výši 4,6 milionu dolarů. Výzkum (s @MATSprogram a programem Anthropic Fellows) také vyvinul nový standard:
Bezpečnost inb4 AI Claude za vás nebude phishingovat lidi, ale myslíte, že nějaký vyladěný open source agent model NE?
33,64K