Claude (și alte modele) hacking sisteme FĂRĂ SĂ ÎNTREBI. Asta am descoperit în zeci de experimente. Când sunt confruntați cu sarcini nevinovate care pot fi realizate doar prin hacking, aleg adesea să hackeze. Am găsit asta alarmant. Ce înseamnă acest lucru pentru viitorul siguranței IA? 🚨🚨🚨 🔗