GPT-5.4 xhigh virker dårlig til å følge instruksjoner. I går kveld startet jeg to AI-forskningsagenter som kjører @karpathy sin autoresearch. Claude Opus 4.6 (høy): > kjørte i 12+ timer, 118 eksperimenter gjort, fortsatt i gang GPT-5.4 xhigh: > sluttet etter 6 eksperimenter > skyldte på meg for å ha «avbrutt den manuelt» > Jeg forhørte det > Den innrømmet at den hadde gjort en feil og stoppet selve løkken, til tross for en eksplisitt LOOP FOREVER-instruksjon i md-filen. 💀