A versão Beta 4.20 do Grok apresenta três melhorias principais em relação ao Grok 4: ➤ A nossa taxa de alucinação mais baixa de sempre na avaliação AA-Omniscience. Quando o Grok não sabia a resposta, ele alucinado uma resposta incorreta 22% das vezes - esta é a taxa de alucinação mais baixa de qualquer modelo que testámos, superando o Claude Haiku 4.5 (25%) ➤ Melhores pontuações para seguimento de instruções e adesão a prompts. No IFBench, o Grok 4.20 ocupa o 1º lugar com 82.9% - um aumento de +29.2 pontos em relação ao Grok 4 ➤ Velocidade líder para a sua inteligência. Com uma velocidade de saída de 265 tokens por segundo na API da xAI, o Grok 4.20 é significativamente mais rápido do que os seus pares e mais de 2x a velocidade de saída observada no Grok 4.1 Fast Parabéns a @xai e @elonmusk pelo lançamento da versão Beta 4.20 0309!
Análise adicional sobre Análise Artificial:
31,93K