Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Claude Opus 4.5 foi lançado hoje.
É de última geração em codificação, agentes e uso de computadores, e é significativamente melhor em tarefas do dia a dia, como produzir folhas de cálculo e apresentações.
Aqui está o que estamos vendo:

O feedback consistente dos testadores internos é que simplesmente "entende." Lida com a ambiguidade, raciocina sobre as compensações sem precisar de ajuda.
Tarefas que eram quase impossíveis para o Sonnet 4.5 agora estão ao alcance.
Por exemplo, damos aos candidatos de engenharia de desempenho um exame em casa notoriamente difícil. Dentro do limite de tempo de 2 horas, o Opus 4.5 obteve uma pontuação mais alta do que qualquer candidato humano já obteve.
É também dramaticamente mais eficiente. No SWE-bench Verificado com esforço médio, o Opus 4.5 supera o Sonnet 4.5 enquanto utiliza 76% menos tokens de saída.
O novo parâmetro de esforço permite que você troque inteligência por custo/latência com um único botão.

295,37K
Top
Classificação
Favoritos

