Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Uma imagem para entender o novo modelo DeepSeek DeepSeek-Math-V2!
DeepSeek acaba de lançar o DeepSeek-Math-V2!
Isso mesmo, este é um modelo especializado na área de raciocínio matemático, e desta vez é um treinamento/ajuste fino baseado no DeepSeek-V3.2, o que significa que o DeepSeek já mudou completamente para a nova arquitetura.
Em termos de desempenho, o IMO 2025 (Competição Internacional de Matemática) alcançou 83,3%, atingindo o nível de medalha de ouro do IMO. O ProofBench-Basic foi um sucesso absoluto, com uma pontuação de 99%, superando todos os outros modelos. E o ProofBench-Advanced ficou atrás apenas do Gemini Deep Think (que é uma plataforma com Agente, não um modelo puro).
Além disso, este ano o primeiro lugar do IMO 2025 também é nosso. Então, eu peguei a pontuação de 83,3% do DeepSeek-Math-V2 e a distribui igualmente entre cada questão, a pontuação deve ser 210 pontos (pontuação máxima de 252 pontos, 83,3% de precisão), o que coloca entre os Estados Unidos (216 pontos) e a Coreia do Sul (203 pontos), ou seja, em 3º lugar.

Top
Classificação
Favoritos

