Метт Махер тестував моделі Frontier у Cursor порівняно з іншими ременями. Курсор підвищив продуктивність моделі в середньому на 11%: Близнюки: 52% → 57% GPT-5.4: 82% → 88% Опус: 77% → 93% Його бенчмарк вимірює, наскільки добре моделі реалізують 100-ознаковий PRD. @cursor_ai стабільно перевершував свої результати.