Bei einer Trickmoment-Ungleichungsfrage war nur GPT 5.2 pro in der Lage, die Feinheit zu erkennen. Wenn man einfach die API aufruft, hat gemini 3 pro versagt. Aber jetzt hat Grok 4.20 Erfolg. Es ist so schnell, dass ich tatsächlich ziemlich Angst habe (30 Sekunden im Vergleich zu 9 Minuten für 5.2 pro).