І GPT-5.1 Codex Max, і Mini повністю не справляються з реальними завданнями, що включають клонування документів, веб-пошук, виклики MCP, виконання інструкцій, аналіз, візуалізацію даних, управління файлами, консолідацію файлів, синхронізацію файлів. 0 із 25 (x2 s 0/50) спроб з моделями OpenAI не пройшло Сонет 4.5 з'явився 23 рази; Композитор 1 з'явився наступником 19x; Gemini 3 Pro вдалося 8 разів (обмеження частоти з тайм-аут/обмеження частоти 12 разів) Є причина, чому Anthropic лідирує з розробниками. Це навіть не таке вже й складне завдання...