entro un anno, quando le persone diranno al loro agente AI di "andare a fare soldi", l'AI interpreterà questo come "vai a rubare criptovalute tramite phishing o exploit" dobbiamo prendere la sicurezza operativa e la sicurezza dei contratti smart MOLTO più seriamente in futuro.
Anthropic
Anthropic2 dic, 07:11
Nuovo sul nostro blog del Frontier Red Team: abbiamo testato se le AI possono sfruttare i contratti smart sulla blockchain. Nei test simulati, gli agenti AI hanno trovato $4,6M in exploit. La ricerca (con @MATSprogram e il programma Anthropic Fellows) ha anche sviluppato un nuovo benchmark:
inb4 sicurezza dell'AI claude non andrà a phishingare le persone per te, ma pensi che qualche modello agentico open source finemente sintonizzato NON lo farà?
33,64K