Claude Opus 4.5 foi lançado hoje. É de última geração em codificação, agentes e uso de computadores, e é significativamente melhor em tarefas do dia a dia, como produzir folhas de cálculo e apresentações. Aqui está o que estamos vendo:
O feedback consistente dos testadores internos é que simplesmente "entende." Lida com a ambiguidade, raciocina sobre as compensações sem precisar de ajuda. Tarefas que eram quase impossíveis para o Sonnet 4.5 agora estão ao alcance.
Por exemplo, damos aos candidatos de engenharia de desempenho um exame em casa notoriamente difícil. Dentro do limite de tempo de 2 horas, o Opus 4.5 obteve uma pontuação mais alta do que qualquer candidato humano já obteve.
É também dramaticamente mais eficiente. No SWE-bench Verificado com esforço médio, o Opus 4.5 supera o Sonnet 4.5 enquanto utiliza 76% menos tokens de saída. O novo parâmetro de esforço permite que você troque inteligência por custo/latência com um único botão.
295,37K