Así que ahora tenemos modelos agentivos poderosos como Opus, pero no muestran impulsos de búsqueda de poder, inclinaciones a mentir, etc. ¿No es esto un golpe fatal para los argumentos apocalípticos de la IA de que estos rasgos (a) necesariamente surgirían con mayores capacidades y (b) serían difíciles de controlar?
Recuerdo cuando "permitir el acceso no autorizado a internet de modelos" era una línea roja crítica que la humanidad simplemente no podía cruzar. Parece que todas estas personas estaban equivocadas, o al menos deberían mover bastante las reglas del objetivo.
1.26K