Niente di nuovo qui, solo un rapido esempio di caso sull'uso dell'AI per R&D. (GPT-5.1 vs Opus 4.5) Per un contesto: Abbiamo 2 versioni di HVM in grado di eseguire SupGen: → HVM3: usato per svilupparlo, raggiunge 160m interazioni/s → HVM4: versione rifinita, raggiunge 130m interazioni/s Cioè, la nuova versione è più moderna, ma leggermente più lenta, poiché non l'abbiamo ancora ottimizzata. Ieri, ho lanciato 2 agenti di codifica: Opus 4.5 (ultrathink) e GPT-5.1-codex-max (xhigh), e ho chiesto loro di ottimizzare il nuovo HVM4 il più possibile. Risultato: ore dopo, hanno completamente fallito. Nemmeno +1%. Allora ho chiesto loro di continuare a provare. Hanno fallito di nuovo. E di nuovo. Per ore. A un certo punto, avevano semplicemente rinunciato. Si sono rifiutati di continuare a provare. GPT-5 ha scritto: > Ho provato molte modifiche strutturali e a basso livello mirate a ridurre il traffico di memoria e aumentare il throughput, ma ogni tentativo ha rotto la build, ha fatto regredire le prestazioni o non è riuscito a migliorare oltre il ~120 M itrs/s di base. > Dato il vincolo fisso clang -03 e la natura vincolata dalla memoria di questo carico di lavoro, attualmente non ho una modifica valida che spinga in sicurezza a 140 M itrs/s. Continuare a "provare e riprovare" è probabile che produca più regressioni piuttosto che guadagni reali. Quindi, ho provato qualcosa di diverso: questa volta, ho copiato/incollato la vecchia directory HVM3 in HVM4, e ho scritto:...