Matt Maher a testé des modèles de pointe dans Cursor par rapport à d'autres harnais. Cursor a amélioré la performance des modèles de 11 % en moyenne : Gemini : 52 % → 57 % GPT-5.4 : 82 % → 88 % Opus : 77 % → 93 % Son benchmark mesure à quel point les modèles mettent en œuvre un PRD de 100 fonctionnalités. @cursor_ai a constamment surpassé.