vuoden sisällä, kun ihmiset sanovat tekoälyagentilleen "mene tekemään rahaa", tekoäly tulkitsee sen niin, että "mene ja varasta kryptoa tietojenkalastelulla tai hyväksikäytöksillä". Meidän täytyy suhtautua OPSEC:iin ja älysopimusten turvallisuuteen paljon vakavammin jatkossa.
Anthropic
Anthropic2.12. klo 07.11
Uutta Frontier Red Team -blogissamme: Testasimme, voivatko tekoälyt hyödyntää lohkoketjuälysopimuksia. Simuloidussa testauksessa tekoälyagentit löysivät 4,6 miljoonan dollarin arvosta haavoittuvuutta. Tutkimus (yhdessä @MATSprogram:n ja Anthropic Fellows -ohjelman kanssa) kehitti myös uuden vertailuarvon:
inb4 tekoälyn turvallisuus Claude ei kierrä kalastelemassa ihmisiä puolestasi, mutta uskotko, että jokin hienosäädetty avoimen lähdekoodin agenttimalli EI tee niin?
33,65K