Saya sekarang telah menguji Opus 4.5 melawan GPT-5.1-Codex-Max pada tugas backend selama 24 jam terakhir, dan sejujurnya, saya tidak dapat memutuskan pemenang yang jelas. Biasanya saat membandingkan model, pemenangnya cukup jelas dengan sangat cepat. Tidak kali ini. Pengujian terus berlanjut.