Matt Maher testował modele frontier w Cursor w porównaniu do innych uprzęży. Cursor zwiększył wydajność modeli średnio o 11%: Gemini: 52% → 57% GPT-5.4: 82% → 88% Opus: 77% → 93% Jego benchmark mierzy, jak dobrze modele wdrażają 100-funkcjonalne PRD. @cursor_ai konsekwentnie osiągał lepsze wyniki.