Mein Modell-Stack nach den wildesten 8 Tagen in der KI: Opus 4.5: Die meisten täglichen Codierungsaufgaben, bei denen ich weiß, wie ich möchte, dass das Modell das macht, was ich will. Schnell, sauber, zuverlässig, aber oft beginnt es, Code zu schreiben, bevor es alle benötigten Informationen erfasst (einmal messen, zweimal schneiden). Codex‑Max: Größere, schwierigere Codierungsaufgaben (insbesondere Backend), bei denen ich nicht den besten Weg vorschreiben möchte, um etwas zu tun. Erforscht, bevor es handelt, daher ist es oft zuverlässiger (zweimal messen, einmal schneiden). GPT‑5.1 Pro: Tiefes Planen, Forschung, hochriskante Arbeiten (wiederum insbesondere Backend), bei denen ich mir keinen Fehler leisten kann. Wenn ich nicht mit der Korrektur subtiler Fehler umgehen möchte, greife ich zu GPT-5.1 Pro. Es trifft die Dinge beim ersten Mal richtig (aber es ist super langsam und im ChatGPT-Interface feststeckend). Gemini 3 Pro: Schreiben, allgemeines Denken und UI-Design. Am besten darin, Frontends poliert aussehen zu lassen, anstatt wie KI-Matsch, aber weniger zuverlässig als andere bei allgemeinen Codierungsaufgaben.