Baik GPT-5.1 Codex Max & Mini benar-benar gagal dalam tugas-tugas yang benar-benar diterapkan yang melibatkan kloning dokumen, pencarian web, panggilan MCP, instruksi berikut, analisis, visualisasi data, manajemen file, konsolidasi file, sinkronisasi file. 0 dari 25 (x2 s 0/50) upaya dengan model OpenAI telah berlalu Soneta 4.5 berhasil 23x; Komposer 1 berhasil 19x; Gemini 3 Pro berhasil 8x (batas kecepatan habis/dibatasi 12x) Ada alasan mengapa Anthropic memimpin dengan pengembang. Ini bahkan bukan tugas yang sulit ...