Ok, penso che il mio esperimento di lasciare l'AI a lavorare su cose 24 ore su 24, 7 giorni su 7 finisca qui. Non funziona. Il codice esplode in complessità, i risultati non sono così buoni, l'AI non riesce a superare muri difficili (è ancora completamente incapace di *afferrare* SupGen), ed è incredibilmente costosa (spesi ~1k negli ultimi 2 giorni). I migliori risultati sono sul compilatore JS, principalmente perché è familiare (rispetto a inets), ma non vale la pena perdere il controllo sul codice. Penso che il sogno di avere AI che lavorano in background e fanno progressi reali su cose che contano (cioè, cose veramente nuove) non sia ancora arrivato. È ancora una macchina bloccata sui propri dati di addestramento, incapace di pensare fuori dagli schemi. È ottima per costruire cose che sono già state costruite. Ma non per cose nuove. Inoltre, programmare normalmente ha il vantaggio sottovalutato di fare due cose contemporaneamente: costruire un codice *e* impararlo. Le AI fanno solo metà di questo. L'altra metà è ovviamente impossibile 🤔
o forse non riesco proprio a sopportare di rispondere a domande stupide seriamente, GPT-5.3 *non può comunicare*. scrive un sacco di cose e poi ti fa DOMANDE sul suo stesso codice. come se tu l'avessi scritto. dando per scontato che tu sappia di cosa sta parlando non ha un modello mentale di ciò che sta accadendo
o forse non riesco proprio a sopportare di rispondere a domande stupide seriamente, GPT-5.3 *non può comunicare*. scrive un sacco di cose e poi ti fa DOMANDE sul suo stesso codice. come se tu l'avessi scritto. dando per scontato che tu sappia di cosa sta parlando non ha alcuna teoria della mente. affatto.
Mi manca sonetto 3.5 volte quando l'AI era solo un'autocompletamento glorificato. Forse dovrei dare a opus 4.6 una possibilità maggiore. Certo, fa più errori logici di gpt 5.3, ma tutto il resto è così molto più piacevole. E se sto spiegando tutta la logica, perché no?
Mi manca il sonetto 3.5 volte quando l'AI era solo un'autocompletamento glorificato. Forse dovrei dare a opus 4.6 una possibilità maggiore. Certo, fa più errori logici rispetto a gpt 5.3, ma tutto il resto è così molto più piacevole. E se sto comunque spiegando tutta la logica... perché no?
Questa mattina: "Il bot Bend→JS è completamente bloccato. L'agente ha esaurito le vittorie facili e ora sta cercando micro-ottimizzazioni sempre più disperate che falliscono tutte. I benchmark non si sono mossi da quando le vittorie iniziali sono arrivate circa 50 round fa." Altri bot subiscono lo stesso destino ):
Questa mattina: "Il bot Bend→JS è completamente bloccato. L'agente ha esaurito le vittorie facili e ora sta cercando micro-ottimizzazioni sempre più disperate che falliscono tutte, mentre fa domande sugli interni di V8. I benchmark non si sono mossi affatto da circa 50 round fa." sospira
73