Claude Opus 4.5 è disponibile da oggi. È all'avanguardia nella programmazione, negli agenti e nell'uso del computer, ed è significativamente migliore nei compiti quotidiani come la creazione di fogli di calcolo e presentazioni. Ecco cosa stiamo osservando:
Il feedback costante dai tester interni è che semplicemente "ci riesce." Gestisce l'ambiguità, ragiona sui compromessi senza bisogno di assistenza. Compiti che erano quasi impossibili per Sonnet 4.5 sono ora a portata di mano.
Ad esempio, diamo ai candidati per l'ingegneria delle prestazioni un esame a casa notoriamente difficile. Entro il limite di tempo di 2 ore, Opus 4.5 ha ottenuto un punteggio più alto di qualsiasi candidato umano abbia mai avuto.
È anche notevolmente più efficiente. Su SWE-bench Verificato con uno sforzo medio, Opus 4.5 supera Sonnet 4.5 utilizzando il 76% in meno di token di output. Il nuovo parametro di sforzo ti consente di scambiare intelligenza per costo/latenza con un'unica manopola.
295,35K