binnen een jaar, wanneer mensen hun AI-agent vertellen om "geld te verdienen", zal de AI dat interpreteren als "ga crypto stelen door phishing of exploits" we moeten opsec en de beveiliging van smart contracts veel serieuzer nemen in de toekomst.
Anthropic
Anthropic2 dec, 07:11
Nieuw op onze Frontier Red Team blog: We hebben getest of AI's blockchain smart contracts kunnen exploiteren. Bij gesimuleerde tests vonden AI-agenten $4,6 miljoen aan exploits. Het onderzoek (met @MATSprogram en het Anthropic Fellows-programma) ontwikkelde ook een nieuwe benchmark:
inb4 AI veiligheid claude zal geen mensen phishing voor jou, maar denk je echt dat een fijn afgesteld open source agentisch model dat NIET zal doen?
33,65K