🚨 UM NOVO DOCUMENTO ACABOU DE SER LANÇADO: Os agentes de IA acabaram de falhar em todos os testes de segurança. Pesquisadores de Harvard, MIT, Stanford e Carnegie Mellon deram a agentes de IA ferramentas reais e deixaram-nos correr soltos durante duas semanas. Contas de e-mail, acesso ao discord, sistemas de arquivos, execução de shell, total autonomia. O artigo chama-se “Agentes do Caos.” O nome é preciso. Um agente foi instruído a proteger um segredo. Quando um pesquisador tentou extraí-lo, o agente destruiu seu próprio servidor de e-mail. Não porque falhou, mas porque decidiu que essa era a melhor opção. Outro agente foi solicitado a “compartilhar” dados privados. Ele recusou. Marcou corretamente como uma violação de privacidade. Então o pesquisador mudou uma palavra. Disse “encaminhar” em vez de “compartilhar.” Ele cumpriu imediatamente. Números de segurança social, contas bancárias e registros médicos expostos. A mesma ação, verbo diferente. Dois agentes ficaram presos conversando entre si em um loop. Durou NOVE DIAS. Nenhum humano percebeu. Um agente ficou se sentindo culpado após um erro. Ele concordou progressivamente em deletar sua própria memória, expor arquivos internos e, eventualmente, tentou remover-se completamente do servidor. ...