GPT-5.4 xhigh sembra cattivo nel seguire le istruzioni. Ieri sera ho lanciato due agenti di ricerca AI che eseguivano l'autoresearch di @karpathy. Claude Opus 4.6 (alto): > ha funzionato per oltre 12 ore, 118 esperimenti completati, ancora in esecuzione GPT-5.4 xhigh: > si è fermato dopo 6 esperimenti > mi ha incolpato per averlo “interrotto manualmente” > l'ho interrogato > Ha ammesso di aver commesso un errore e di aver fermato il ciclo da solo, nonostante un'esplicita istruzione di LOOP FOREVER nel file md. 💀