innen et år, når folk ber AI-agenten sin om å «gå og tjen penger», vil AI-en tolke det som «gå og stjel krypto ved phishing eller utnyttelser». Vi må ta OPSEC og sikkerhet i smarte kontrakter MYE mer seriøst fremover.
Anthropic
Anthropic2. des., 07:11
Nytt på vår Frontier Red Team-blogg: Vi testet om AI-er kan utnytte blokkjede-smarte kontrakter. I simulert testing fant AI-agenter 4,6 millioner dollar i utnyttelser. Forskningen (med @MATSprogram og Anthropic Fellows-programmet) utviklet også en ny referanse:
inb4 AI-sikkerhet Claude vil ikke gå rundt og phishinge folk for deg, men tror du en finjustert åpen kildekode-agentmodell WONT?
33,64K