Claude Opus 4.5 is vandaag uitgebracht. Het is state-of-the-art op het gebied van codering, agents en computergebruik, en aanzienlijk beter in dagelijkse taken zoals het maken van spreadsheets en presentaties. Dit is wat we zien:
De consistente feedback van interne testers is dat het gewoon "het begrijpt." Het gaat om met ambiguïteit, redeneert over afwegingen zonder begeleiding. Taken die bijna onmogelijk waren voor Sonnet 4.5 zijn nu binnen handbereik.
Bijvoorbeeld, we geven kandidaten voor prestatie-engineering een berucht moeilijk thuisexamen. Binnen de tijdslimiet van 2 uur scoorde Opus 4.5 hoger dan ooit een menselijke kandidaat heeft gedaan.
Het is ook dramatisch efficiënter. Op SWE-bench Verifieerd met gemiddelde inspanning, verslaat Opus 4.5 Sonnet 4.5 terwijl het 76% minder outputtokens gebruikt. De nieuwe inspanningsparameter laat je toe om intelligentie in te ruilen voor kosten/latentie met een enkele draaiknop.
295,36K