De Grok 4.20 Beta toont drie belangrijke verbeteringen ten opzichte van Grok 4: ➤ Onze laagste hallucinatieratio ooit op de AA-Omniscience evaluatie. Wanneer Grok het antwoord niet wist, hallucineerde het 22% van de tijd een onjuist antwoord - dit is de laagste hallucinatieratio van elk model dat we hebben getest, beter dan Claude Haiku 4.5 (25%) ➤ Top scores voor het volgen van instructies en het naleven van prompts. Op IFBench neemt Grok 4.20 de #1 plek in met 82,9% - een stijging van +29,2 punten ten opzichte van Grok 4 ➤ Leidend in snelheid voor zijn intelligentie. Met 265 tokens per seconde output snelheid op de xAI API, is Grok 4.20 aanzienlijk sneller dan zijn gelijken en meer dan 2x de output snelheid van Grok 4.1 Fast Gefeliciteerd aan @xai en @elonmusk met de lancering van de 4.20 Beta 0309!
Verdere analyse over Kunstmatige Analyse:
31,95K