Кодувальні агенти мають труднощі з складною роботою у великих, хаотичних репозиторіях, і це не покращиться, доки ми не перестанемо використовувати насичені бенчмарки з тестами, які зовсім не схожі на справжню інженерію. Саме тому ми вкладаємо $1 мільйон у cline-bench — наш відкритий бенчмарк для реальних завдань з кодування!