Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Claude Opus 4.5: recenzie completă
Aceasta este cea mai bună versiune de model din foarte, foarte mult timp când vine vorba de programare. Mă uimește cât de bun este. Nu am văzut o îmbunătățire atât de mare de la lansarea originală a gpt-4-0314
Principala îmbunătățire este că în sfârșit au gândit cum să "gândească" corect.
Nu mai face greșeli logice groaznice în gândirea sa.
Probleme de genul "Bine, o să fac teste acum. <Testele eșuează> Grozaav! Testele trec." nu mai există.
Aceasta se generalizează practic la TOATĂ logica când vine vorba de cod – extrem de rar, dacă vreodată, face greșeli.
Următorul mare prag: Nu mai scrie cod slop! Este ceva uriaș. Cu Codex, poți să-l faci să scrie cod care funcționează. Dar scrie cod groaznic – funcții inutile, abstracții proaste etc. Este frustrant, pentru că funcționează pe termen scurt, dar pe termen lung modelul se va bloca într-un colț unde nu va mai putea lucra cu codul pe care l-a scris singur.
Nu este cazul Opus. Nu doar că scrie cod elegant, dar știe și cum să refactorizeze codul slop în cod non-slop. Înțelege profund baza de cod și poate găsi soluții elegante care nu sunt doar refactorizări "mecanice".
Este foarte autonom și independent. De unul singur, atunci când întâmpină probleme, va crea exemple minime reproductibile, va încerca să separe în două de unde provine eroarea, apoi o va corecta fără să rămână blocat în vizuini de iepure. Chiar dacă eroarea este într-o parte neînrudită a codului – cod pe care nici măcar nu l-a scris singur!!
De asemenea, FACE EXACT CE SPUI, FĂRĂ SĂ LASE COLȚURI! Este ceva uriaș!! Folosirea Codex este practic un joc de tip whack-a-mole, unde înțelege ce vrei să facă, dar e prea dificil, așa că se recompensează și ajunge la o soluție proastă pe care nu o vrei.
Opus chiar abordează problema și o rezolvă corect, chiar dacă este dificil.
Înțelegerea contextului pe termen lung este aproape perfectă. Combinat cu mecanismul de compactare disponibil implicit în Claude Code, poți avea practic o conversație infinit de lungă în care înțelege totul în interiorul ei, fără nicio degradare.
În ceea ce privește designul, cercetarea, venirea cu idei noi. E mai bun, dar nu chiar la nivelul unui om expert. Poate propune soluții pe care le-aș considera design bun, dar încă nu poate "gândi cu portaluri". Totuși, o îmbunătățire bună față de ce aveam înainte, care practic nu exista.
Toate cele de mai sus le-am adunat testând în ultimele zile, unde sarcina este să scriu un interpret pentru un limbaj pe care îl proiectam pe loc. Este un design foarte de nișă, similar cu Self și Smalltalk, doar că noi construim limbajul chiar în interiorul limbajului. Acest lucru duce la scenarii extrem de dificile în care încerci să definești cum funcționează funcțiile – în interiorul limbajului – când încă nu ai funcții! Și încă face o treabă magnifică. Uneori, nici măcar nu înțeleg pe deplin ce îi cer să facă, dar Opus înțelege și face o treabă bună.
TL; DR: Este Sonetul 3.5 al anului 2025. Încearcă. Fă-o acum
Limită superioară
Clasament
Favorite

