🚨Opus 4.6 ha appena superato interi team di cybersecurity. 22 bug. 14 di alta gravità. 14 giorni. Lascia che questo affondi. E non si è fermato a trovarli. Ha scritto anche le patch. Ecco cosa ha reso tutto questo possibile: → Claude ha controllato il proprio lavoro utilizzando i verificatori di compiti → Ha confermato che il bug era effettivamente risolto → Ha confermato che nient'altro si è rotto nel processo → Ha presentato casi di test minimi e prove dettagliate di concetto insieme a ogni rapporto Il team di Firefox ha definito le sottomissioni affidabili. Non è una cosa da poco. La maggior parte dei ricercatori umani non presenta a quel livello. Gli ingegneri di cybersecurity chiedono 200.000 dollari all'anno. Claude ha svolto il loro lavoro annuale in 14 giorni.