Sonnet 4.5 ble nettopp utgitt - den tar #1-plassen på våre finans- og programmeringsstandarder! Vi hadde sjansen til å teste den nye @claudeai-modellen før lansering og fant ut at den var eksepsjonelt kapabel, spesielt for agentapplikasjoner.
(1/6)
GPT-5 Codex oppnådde imponerende ytelse på tvers av nesten alle benchmarks vi evaluerte! Mest bemerkelsesverdig er forbedringen på 10 % i Terminal-Bench i forhold til forrige #1, GPT-5. Gratulerer til det @OpenAI teamet med en sterk kodemodell!
(1/6)