Abordarea "model-first" a openAI când vine vorba de agenți, cu harness-uri foarte subțiri și cea mai mare parte a muncii fiind condusă de model în sine (spre deosebire de abordarea lui Claude, care are o integrare mult mai strânsă între model<>harness), este destul de interesantă pentru că este clar o experiență mult mai slabă, "se simte" mai puțin bine pentru că e mai greu de spus ce vor face de fapt agenții, De asemenea, "pare" mai puțin inteligent uneori, dar rezultatele sunt extrem de echivalente între 5.2-codex-xhigh și opus 4.5 (modelul OpenAI fiind substanțial mai bun la lucruri tehnice, mai complexe și precise uneori, după părerea mea)
Cred că OpenAI ar beneficia de proiecte care să apară (fără comunicate mari de presă), să încerce lucruri noi și îndrăznețe în jurul modelelor lor nebunești și să vadă ce funcționează și cum reacționează oamenii – multe lucruri evidente de făcut în Claude Code / Opencode / amplificator care sunt interesante și pot fi 10x pentru că deții modelul + îl servești
632