GPT-5.4 xhigh lijkt slecht in het opvolgen van instructies. Gisteravond lanceerde ik twee AI-onderzoeksagenten die @karpathy’s autoresearch uitvoerden. Claude Opus 4.6 (hoog): > liep meer dan 12 uur, 118 experimenten gedaan, nog steeds aan het draaien GPT-5.4 xhigh: > stopte na 6 experimenten > gaf mij de schuld van "handmatig onderbreken" > ik ondervroeg het > Het gaf toe dat het een fout had gemaakt en stopte de lus zelf, ondanks een expliciete LOOP FOREVER-instructie in het md-bestand. 💀