O GPT-5.4 xhigh parece mau a seguir instruções. Na noite passada, lancei dois agentes de pesquisa em IA a correr o autoresearch do @karpathy. Claude Opus 4.6 (alto): > correu durante mais de 12 horas, 118 experiências feitas, ainda a correr GPT-5.4 xhigh: > parou após 6 experiências > deu-me a culpa por "interromper manualmente" > eu interroguei-o > Ele admitiu que cometeu um erro e parou o loop por si mesmo, apesar de uma instrução explícita de LOOP FOREVER no arquivo md. 💀