وكلاء البرمجة يواجهون صعوبة في الأعمال المعقدة في مستودعات كبيرة وفوضوية، ولن يتحسن هذا حتى نتوقف عن استخدام معايير الأداء المشبعة مع اختبارات لا تشبه الهندسة الحقيقية. لهذا السبب نخصص مليون دولار على cline-bench، وهو معيارنا المفتوح لمهام البرمجة الواقعية!