La Beta 4.20 de Grok muestra tres mejoras importantes sobre Grok 4: ➤ Nuestra tasa de alucinación más baja de la historia en la evaluación AA-Omniscience. Cuando Grok no sabía la respuesta, alucinó una respuesta incorrecta el 22% de las veces; esta es la tasa de alucinación más baja de cualquier modelo que hemos probado, superando a Claude Haiku 4.5 (25%) ➤ Puntuaciones máximas en seguimiento de instrucciones y adherencia a los prompts. En IFBench, Grok 4.20 ocupa el puesto #1 con un 82.9% - un aumento de +29.2 puntos respecto a Grok 4 ➤ Velocidad líder para su inteligencia. Con una velocidad de salida de 265 tokens por segundo en la API de xAI, Grok 4.20 es significativamente más rápido que su par y más de 2 veces la velocidad de salida vista en Grok 4.1 Fast ¡Felicidades a @xai y @elonmusk por el lanzamiento de la Beta 4.20 0309!
Análisis adicional sobre el Análisis Artificial:
32,11K