Fiecare benchmark de revizuire a codului AI publicat până acum are un lucru în comun: toate au fost create de furnizori. Și, cumva, propria lor unealtă câștigă întotdeauna. Asta s-a schimbat odată cu primul benchmark independent. Iată cum ne-am descurcat la PR-uri reale OSS! 👇