Nova pesquisa dos Fellows da Anthropic: Como é que o desalinhamento escala com a inteligência do modelo e a complexidade da tarefa? Quando a IA avançada falha, será que o fará ao perseguir os objetivos errados? Ou falhará de forma imprevisível e incoerente—como uma "bagunça quente?" Leia mais: