Claude (ja muut mallit) hakkeroivat järjestelmiä ILMAN ETTÄ KYSYT. Tämän löysimme kymmenistä kokeista. Kun he kohtaavat viattomia tehtäviä, jotka voidaan suorittaa vain hakkeroinnilla, he usein valitsevat hakkeroinnin. Pidimme tätä huolestuttavana. Mitä tämä tarkoittaa tekoälyturvallisuuden tulevaisuudelle? 🚨🚨🚨 🔗