GPT 5.4 Pro hat gerade den schwierigsten Mathematik-Benchmark, FrontierMath Tier 4, mit 38% übertroffen. Diese 50 Forschungs-Mathematikprobleme können Mathematiker Wochen kosten, um sie zu lösen. Vor einem Jahr lag das Beste bei 2% (o3). Das beste Open-Source-Modell liegt bei 4,2% (Kimi K2.5). Unglaublich beeindruckend.