Ahora llevo probando Opus 4.5 contra GPT-5.1-Codex-Max en tareas de backend durante las últimas 24 horas y, sinceramente, no consigo decidir un ganador claro. Normalmente, al comparar modelos, el ganador queda bastante claro muy rápido. Esta vez no. Las pruebas continúan.