Ich habe jetzt 24 Stunden lang Opus 4.5 gegen GPT-5.1-Codex-Max bei Backend-Aufgaben getestet, und ehrlich gesagt kann ich mich nicht für einen klaren Gewinner entscheiden. Normalerweise ist der Gewinner beim Vergleich von Modellen sehr schnell ziemlich klar. Diesmal nicht. Die Tests gehen weiter.