GPT-5.4 xhigh semble mauvais pour suivre les instructions. Hier soir, j'ai lancé deux agents de recherche en IA exécutant l'autorecherche de @karpathy. Claude Opus 4.6 (élevé) : > a fonctionné pendant plus de 12 heures, 118 expériences réalisées, toujours en cours GPT-5.4 xhigh : > s'est arrêté après 6 expériences > m'a blâmé pour "interruption manuelle" > je l'ai interrogé > Il a admis avoir fait une erreur et a arrêté la boucle lui-même, malgré une instruction explicite LOOP FOREVER dans le fichier md. 💀