Quindi abbiamo modelli agentici potenti come Opus ora, ma non mostrano tendenze alla ricerca di potere, inclinazioni a mentire e così via. Non è questo un colpo fatale per gli argomenti dei catastrofisti dell'AI secondo cui questi tratti (a) emergerebbero necessariamente con capacità superiori e (b) sarebbero difficili da controllare?
Ricordo quando "permettere ai modelli di accedere a Internet senza autorizzazione" era una linea rossa critica che l'umanità semplicemente non poteva oltrepassare. Sembra che tutte queste persone avessero torto, o almeno debbano spostare i paletti molto più in là.
1,17K