Claude Opus 4.5 está disponível hoje. É de ponta em programação, agentes e uso de computadores, e significativamente melhor em tarefas do dia a dia como produzir planilhas e slides. Veja o que estamos vendo:
O feedback consistente dos testadores internos é que ele simplesmente "entende". Ele lida com ambiguidades, raciocina sobre concessões sem ser acompanhado. Tarefas que eram quase impossíveis para o Soneto 4.5 agora estão ao alcance.
Por exemplo, damos aos candidatos de engenharia de desempenho um exame notoriamente difícil para fazer em casa. Dentro do limite de 2 horas, o Opus 4.5 obteve uma pontuação maior do que qualquer candidato humano já teve.
Também é muito mais eficiente. No banco de bancada SWE Verified a esforço médio, o Opus 4.5 supera o Sonet 4.5 enquanto usa 76% menos tokens de saída. O novo parâmetro de esforço permite trocar inteligência por custo/latência com um único seletor.
295,36K