Claude Opus 4.5 kommer ut i dag. Det er topp moderne når det gjelder koding, agenter og databruk, og betydelig bedre til hverdagslige oppgaver som å lage regneark og lysbilder. Her er hva vi ser:
Den konsekvente tilbakemeldingen fra interne testere er at den bare «forstår det». Den håndterer tvetydighet, argumenter om avveininger uten å holde i hånden. Oppgaver som var nærmest umulige for Sonnet 4.5, er nå innen rekkevidde.
For eksempel gir vi kandidater til prestasjonsingeniør en notorisk vanskelig hjemmeeksamen. Innenfor 2-timers tidsgrensen scoret Opus 4.5 høyere enn noen annen menneskelig kandidat noen gang har gjort.
Det er også dramatisk mer effektivt. På SWE-bench verifisert ved middels innsats slår Opus 4.5 Sonnet 4.5 samtidig som den bruker 76 % færre output-tokens. Den nye innsatsparameteren lar deg bytte intelligens mot kostnad/latens med én eneste skive.
295,35K