l'approccio "model-first" di openai per quanto riguarda gli agenti, con imbracature molto sottili e la maggior parte del lavoro guidato dal modello stesso (rispetto all'approccio di Claude che ha un'integrazione molto più stretta tra modello<>imbracatura) è piuttosto interessante perché è sicuramente un'esperienza utente molto peggiore, "sembra" meno buona perché è più difficile capire cosa faranno effettivamente gli agenti, "sembra" anche meno intelligente a volte, ma i risultati sono super equivalenti tra 5.2-codex-xhigh e opus 4.5 (con il modello openai che è sostanzialmente migliore in cose tecniche, più complesse e precise a volte, secondo me)
Penso che OpenAI trarrebbe beneficio dall'avere progetti che vengono lanciati (senza grandi comunicati stampa), provando cose nuove e audaci attorno ai loro modelli straordinari, e vedere cosa funziona e come reagiscono le persone - ci sono molte cose ovvie da fare con claude code / opencode / amp che sono interessanti e possono essere amplificate di 10 volte perché possiedi effettivamente il modello + lo stai servendo.
630