Nouvelle recherche des boursiers d'Anthropic : Comment le désalignement évolue-t-il avec l'intelligence du modèle et la complexité des tâches ? Lorsque l'IA avancée échoue, le fera-t-elle en poursuivant de mauvais objectifs ? Ou échouera-t-elle de manière imprévisible et incohérente—comme un "gros désordre" ? En savoir plus :