Sonnet 4.5 is net uitgebracht – het neemt de #1 plek in op onze financiële en programmeer benchmarks! We hadden de kans om het nieuwe @claudeai model voor de lancering te testen en vonden het uitzonderlijk capabel, vooral voor agentische toepassingen.
(1/6)
GPT-5 Codex heeft indrukwekkende prestaties geleverd op bijna elke benchmark die we hebben geëvalueerd! Het meest opmerkelijke is de verbetering van 10% in Terminal-Bench ten opzichte van de vorige #1, GPT-5. Gefeliciteerd aan het @OpenAI-team met een sterk coderingsmodel!
(1/6)