GPT-5.4 xhigh здається поганим у виконанні інструкцій. Минулої ночі я запустив два агенти ШІ, які запускають автодослідження @karpathy. Claude Opus 4.6 (високий): > працював 12+ годин, проведено 118 експериментів, досі працює GPT-5.4 xhigh: > зупинився після 6 експериментів > звинувачував мене в тому, що я «ручно перебивав» це > я його допитував. > Він визнав свою помилку і зупинив сам цикл, незважаючи на явну інструкцію LOOP FOREVER у файлі md. 💀