O Sonnet 4.5 foi lançado – ocupa o primeiro lugar nos nossos benchmarks de finanças e programação! Tivemos a oportunidade de testar o novo modelo @claudeai antes do lançamento e achámos que é excepcionalmente capaz, especialmente para aplicações agenticas.
(1/6)
O GPT-5 Codex alcançou um desempenho impressionante em quase todos os benchmarks que avaliámos! O mais notável é a sua melhoria de 10% no Terminal-Bench em relação ao anterior #1, GPT-5. Parabéns à equipa da @OpenAI por um modelo de codificação forte!
(1/6)