Matt Maher menguji model perbatasan di Cursor v. harness lainnya. Kursor meningkatkan performa model rata-rata 11%: Gemini: 52% → 57% GPT-5.4: 82% → 88% Opus: 77% → 93% Benchmark-nya mengukur seberapa baik model mengimplementasikan PRD 100 fitur. @cursor_ai secara konsisten mengungguli.