GPT 5.4 Pro právě překonal nejtěžší matematický benchmark, FrontierMath Tier 4, s 38 %. Těchto 50 výzkumných matematických úloh může matematikům zabrat týdny. Před rokem byl nejlepší 2 % (O3). Nejlepší open source model je 4,2 % (Kimi K2.5) Neuvěřitelně působivé.