Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jeffrey Emanuel
Sună atât de stupid, dar unul dintre cele mai mari trucuri de productivitate atunci când folosești Claude Code cu Opus 4.1 este acesta: după ce i-ai cerut lui CC să implementeze o caracteristică sau să repare o eroare sau orice altceva, și după ce spune că a finalizat totul, îi spui în mod repetat următoarele din nou și din nou până când nu mai găsește greșeli (ceea ce uneori durează până la 7 sau 8 încercări!):
"Grozav, acum vreau să citiți cu atenție tot codul nou pe care tocmai l-ați scris și alte coduri existente pe care tocmai le-ați modificat cu "ochi proaspeți", căutând foarte atent orice erori evidente, erori, probleme, probleme, confuzie etc."
Da, durează ceva timp, dar de aceea este atât de util să ai o grămadă de sesiuni CC deschise simultan. Apoi puteți roti prin ele, lipind acea propoziție din nou și din nou.
Cumva, chestia cu "ochi proaspeți" schimbă modul în care percepe ceea ce tocmai a scris într-un mod cu adevărat util.
În mod ciudat, acest truc nu pare să funcționeze la fel de bine cu gândirea GPT-5 - tinde să spună doar "Da, totul arată bine!" Claude este mult mai predispus la îndoieli și la greșeli neglijente prima dată, dar bun la prinderea lor dacă au suficiente șanse.
4,82K
Oricine de la OpenAI a decis să spargă API-ul pentru GPT-5 (și o3, este o problemă veche) să schimbe parametrul "max_tokens" în "max_completion_tokens" în încercarea de a clarifica lucrurile... Ai făcut o mare greșeală. Nu va acoperi niciodată nenumăratele ore pierdute de dezvoltatori cu cod defect.

1,42K
După alte câteva zile de utilizare intensă a GPT-5 prin Cursor și prin modelul GPT-5 Pro în aplicația web, susțin tot ce am spus despre faptul că este un model mult mai inteligent și mai bun la codare decât Opus 4.1
Încă îmi place Opus și consider că ergonomia lui Claude Code este mai frumoasă în multe privințe, dar dacă încerci să faci lucruri cu adevărat dificile care necesită o gândire cu adevărat inteligentă și abilități de informatică, GPT-5 este nivelul următor.
Dar bănuiesc că acest lucru apare doar atunci când modul de efort de raționament este setat la cel puțin mediu și se manifestă cu adevărat cu setarea efortului ridicat.
Un bun exemplu de problemă este pregătirea "liniilor roșii" ale documentelor a două documente juridice lungi și complexe. Nu versiuni diferite ale aceluiași document, ci două documente diferite care provin dintr-un șablon general partajat.
Aceasta este o problemă foarte, foarte dificilă de făcut o treabă bună și necesită multe trucuri și euristici inteligente pentru a oferi performanțe și o calitate decentă a rezultatului (vorbesc despre utilizarea tehnicilor tradiționale de programare aici, nu despre utilizarea LLM-urilor pentru a face această comparație).
GPT-5 cu agentul Cursor poate pur și simplu să vină cu mai multe idei mai bune, inteligente (dar pragmatice) mai repede și să le implementeze corect și fără prea multă mână, în comparație cu Opus4.1.
Depinde totuși la ce lucrezi. Încă cred că prefer codul frontend în NextJS de la Opus, de exemplu.
Dar ar trebui să verifici singur propriile probleme reale și să nu ai încredere în toți oamenii care spun că modelul este nasol și că este dovada că ne-am lovit de un zid.
Fie folosesc versiunea gratuită proastă fără să se gândească, fie habar nu au cum să solicite eficient, fie își lasă sentimentele față de OpenAI și Altman să le coloreze opiniile.
35,97K
Cred că cel mai mare compliment pe care îl pot face @patrickc și echipei Stripe este că au o reputație atât de bună și un istoric de a crea UI/UX cu adevărat rafinat și intuitiv pentru serviciile lor, încât este foarte util să le menționezi după nume în solicitările de codare pentru a obține rezultate mai bune de la agenții de codare AI.
De exemplu, am o variantă a acestuia salvată în editorul meu de text și o lipesc în Claude Code de cel puțin 10 ori pe zi:
"Vreau să faceți o treabă spectaculoasă construind componente UI/UX de clasă mondială pentru afișarea acestor rapoarte de notare, arătând atât detaliile, cât și "insigne" sau "carduri de rezumat", cu un accent intens pe a face cea mai atrăgătoare din punct de vedere vizual, ușor de utilizat, intuitivă, elegantă, lustruită, "la nivel Stripe" de UI/UX de calitate posibilă pentru acest lucru, care folosește bibliotecile bune care fac deja parte din proiect."
Apoi îi spun că orice a făcut nu este chiar atât de grozav ("îngrozitor" sau "incredibil de rău"), chiar dacă este deja destul de bun și că trebuie să-l îmbunătățească DRAMATIC pentru a ajunge cu adevărat la niveluri de clasă Stripe de încântare și șlefuire a utilizatorului, lustruire, intuitivitate etc.
Practic, aplicarea tehnicii Steve Jobs Gaslighting pentru a obține iterativ rezultate "nebunești de grozave".
Și da, acest lucru funcționează incredibil de bine dacă continui să o faci din nou și din nou. Trucul este că trebuie să includeți TOATE acele adjective, altfel se vor transforma în pictograme care se învârt și pulsează ca acrobații ("alunecoase" și "atrăgătoare vizual"); aveți nevoie de alți termeni precum "lustruit" și "intuitiv" și "nivel de dungi" pentru a tempera asta, astfel încât să fie, de asemenea, oarecum minimalist și plăcut de utilizat în practică.
Mă bucur că nu trebuie să lucrez pentru mine ca agent AI :/
1,7K
Citiți noul document GSPO de la echipa Qwen.
Este amuzant cât de mult aceste mari îmbunătățiri teoretice, în ciuda faptului că au o bază fundamentală aparent profundă (în acest caz, că optimizarea pe secvențe de jetoane este mai bună decât optimizarea pe jetoane individuale), se rezumă în cele din urmă la a lăsa gradientele să curgă mai bine prin evitarea problemelor de condiționare numerică.
Când faci un pas înapoi și te uiți la el, GSPO este fundamental o modalitate de a obține o condiționare numerică mai bună prin media lucrurilor împreună mai mult în actualizări pentru a evita denivelările zgomotoase (aproape ca și cum ai folosi impulsul în rmsprop sau Adam) și, de asemenea, ignorând actualizările care ar duce la situații numeric "periculoase" în ceea ce privește condiționarea.
Dar totul are sens dintr-o perspectivă istorică, deoarece învățarea profundă a explodat cu adevărat atunci când ne-am dat seama cum să evităm problema gradientului de dispariție/explozie folosind lucruri precum impulsul în optimizatoare. Deci, într-un fel, acesta este pur și simplu cel mai recent pas în acea tradiție de a naviga în peisajul pierderilor într-un mod mai robust pentru a evita "conducerea într-un șanț".
3,33K
Limită superioară
Clasament
Favorite
La modă pe lanț
La modă pe X
Principalele finanțări recente
Cele mai importante