GPT 5.4 Pro تجاوز أصعب اختبار رياضيات، وهو FrontierMath Tier 4، بنسبة 38٪. هذه المسائل الرياضية الخمسين على مستوى البحث قد تستغرق أسابيع من علماء الرياضيات لحلها. قبل عام، كان الأفضل 2٪ (O3). أفضل نموذج مفتوح المصدر هو 4.2٪ (Kimi K2.5) مثير للإعجاب بشكل جنوني.