Matt Maher a testat modele frontieră în cazul Cursor v. alte hamuri. Cursorul a crescut performanța modelului cu 11% în medie: Gemeni: 52% → 57% GPT-5.4: 82% → 88% Opus: 77% → 93% Benchmark-ul său măsoară cât de bine implementează modelele un PRD cu 100 de caracteristici. @cursor_ai depășit constant performanțele.