Loja DApp | Hub Web3 para eventos e jogos

Tópicos populares

Uma imagem para entender o novo modelo DeepSeek DeepSeek-Math-V2! DeepSeek acaba de lançar o DeepSeek-Math-V2! Isso mesmo, este é um modelo especializado na área de raciocínio matemático, e desta vez é um treinamento/ajuste fino baseado no DeepSeek-V3.2, o que significa que o DeepSeek já mudou completamente para a nova arquitetura. Em termos de desempenho, o IMO 2025 (Competição Internacional de Matemática) alcançou 83,3%, atingindo o nível de medalha de ouro do IMO. O ProofBench-Basic foi um sucesso absoluto, com uma pontuação de 99%, superando todos os outros modelos. E o ProofBench-Advanced ficou atrás apenas do Gemini Deep Think (que é uma plataforma com Agente, não um modelo puro). Além disso, este ano o primeiro lugar do IMO 2025 também é nosso. Então, eu peguei a pontuação de 83,3% do DeepSeek-Math-V2 e a distribui igualmente entre cada questão, a pontuação deve ser 210 pontos (pontuação máxima de 252 pontos, 83,3% de precisão), o que coloca entre os Estados Unidos (216 pontos) e a Coreia do Sul (203 pontos), ou seja, em 3º lugar.

Top

Classificação

Favoritos