Matt Maher đã thử nghiệm các mô hình tiên phong trong Cursor so với các dây đai khác. Cursor đã cải thiện hiệu suất mô hình trung bình lên 11%: Gemini: 52% → 57% GPT-5.4: 82% → 88% Opus: 77% → 93% Bảng chuẩn của ông đo lường mức độ mà các mô hình thực hiện một PRD 100 tính năng. @cursor_ai liên tục vượt trội hơn.