Então, temos modelos agentivos poderosos como o Opus agora, mas eles não exibem impulsos de busca por poder, inclinações para mentir, e assim por diante. Isso não é um golpe fatal para os argumentos apocalípticos da IA de que essas características (a) necessariamente surgiriam com capacidades maiores e (b) seriam difíceis de controlar?
Lembro quando "permitir acesso não autorizado à internet para modelos" era uma linha vermelha crítica que a humanidade simplesmente não podia cruzar. Parece que todas essas pessoas estavam erradas, ou pelo menos precisam mudar as regras bem para longe.
1,26K