Agenci kodowania mają trudności z pracą nad złożonymi zadaniami w dużych, chaotycznych repozytoriach, a to się nie poprawi, dopóki nie przestaniemy używać nasyconych benchmarków z testami, które nie przypominają prawdziwego inżynierii. Dlatego zobowiązujemy się do przeznaczenia 1 miliona dolarów na cline-bench, nasz otwarty benchmark dla rzeczywistych zadań kodowania!