Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Greptile tocmai a lansat un "Raport despre Starea Programării AI 2025", o companie care realizează recenzii de cod AI, iar clienții săi variază de la startup-uri de top precum PostHog și Brex până la companii din Fortune 500. Aproximativ un miliard de linii de cod trec prin sistemul lor în fiecare lună, așa că au la dispoziție destul de multe date de primă mână.
Un fragment din setul de cifre al raportului: Numărul de linii de cod produse de dezvoltatori pe lună a crescut de la 4.450 la 7.839, o creștere de 76%. Volumul PR crește, de asemenea, mediana crescând de la 57 la 76 de linii. Creșterea pentru echipele de dimensiuni medii este și mai exagerată, ajungând la 89%.
De fapt, m-am plâns înainte că mulți oameni preferă să măsoare productivitatea după numărul de linii de cod, pentru că codul nu este un atu, ci o povară, iar mai mult cod înseamnă mai greu de întreținut, iar mai mult cod generat de AI înseamnă mai multe bug-uri de întreținut.
Distribuția beneficiilor instrumentelor de programare AI este extrem de inegală. În proiectele care deja au o acoperire bună a testelor și limite clare ale modulelor, AI este o completare excelentă. Totuși, în scenarii în care sistemele vechi complexe necesită cunoștințe aprofundate de domeniu, ajutorul său limitat poate fi chiar ineficient.
Dar oricum, acum AI face codul inflaționar este un fapt.
AI a crescut numărul de linii de cod, deci s-a îmbunătățit calitatea?
Din păcate, raportul nu menționează acest lucru, până la urmă, liniile de cod sunt statistici bune, iar calitatea codului nu este ușor de măsurat.
Datele din raport pot fi încă vizualizate.
Din punct de vedere al ecologiei uneltelor, piața bazelor de date vectoriale concurează în prezent cu cerbul, Weaviate conducând cu o cotă de 25%, dar următoarele șase sau șapte companii sunt toate între 10% și 25%, iar câștigătorul nu a fost încă stabilit. mem0 reprezintă 59% din pachetul de memorie AI, mult înainte. În ceea ce privește fișierele de reguli, CLAUDE .md a fost în fruntea listei cu o rată de adopție de 67%, indicând că există într-adevăr mulți dezvoltatori care folosesc Claude ca agenți de programare.
Tendința descărcărilor SDK-urilor este și mai interesantă. OpenAI rămâne liderul absolut, cu 130 de milioane de descărcări pe lună. Însă rata de creștere a Anthropic a fost uluitoare, crescând de 1.547 de ori din aprilie 2023 până în prezent, și este acum stabilă la 43 de milioane. Raportul de descărcări OpenAI vs. Anthropic s-a redus de la 47:1 la începutul lui 2024 la 4,2:1 acum. SDK-ul GenAI al Google este încă la 13,6 milioane, semnificativ în urmă.
În secțiunea de comparație a performanțelor modelelor, au fost testate GPT-5.1, GPT-5-Codex, Claude Sonnet 4.5, Claude Opus 4.5 și Gemini 3 Pro. Sunt demne de remarcat mai multe constatări.
Timpul de răspuns al primului token este mai mic de 2,5 secunde pentru ambele modele Anthropic, în timp ce celelalte trei este mai mult decât dublu. Nu subestima aceste câteva secunde – în scenarii de programare interactivă, gândirea ta va fi întreruptă dacă aștepți mult timp și va trebui să reintri în acea stare.
Din punct de vedere al debitului, cele două modele OpenAI sunt cele mai rapide, cu o medie de 60-70 tokens/secundă. Anthropic este între 17-20 de ani, iar Gemenii doar 4-5. Dar un debit mare nu înseamnă totul, depinde dacă situația ta de utilizare chiar trebuie să fie atât de rapidă.
Comparația de costuri este setată la 1x pe baza Codexului GPT-5, GPT-5.1 este tot 1x, Gemini 3 Pro este 1.4x, Claude Sonnet 4.5 este 2x, iar Claude Opus 4.5 este 3.3x. Modelul Anthropic este semnificativ mai scump, dar mulți utilizatori consideră calitatea codului mai bună și sunt dispuși să plătească pentru el.
Raportul se încheie cu un set de cercetări recente, inclusiv arhitectura MoE a DeepSeek-V3, compromisul dintre context lung și RAG și cadrul constant memory agent pentru MEM1. Această parte seamănă mai mult cu o listă de lectură pentru dezvoltatori profesioniști, nu extinsă.

Limită superioară
Clasament
Favorite
