Pelo que posso perceber, não há benchmarks para o Grok 4.2, certo? Todos os outros modelos em pré-lançamento que vi tinham pelo menos alguns benchmarks. Mesmo que sejam falhos (e os benchmarks são falhos), eles ajudam a ver as tarefas para as quais o modelo pode valer a pena tentar.