Grok 4.20 Beta viser tre store forbedringer sammenlignet med Grok 4: ➤ Vår laveste hallusinasjonsrate noensinne på AA-Omniscience-evalueringen. Når Grok ikke visste svaret, hallusinerte den et feil svar 22 % av gangene – dette er den laveste hallusinasjonsraten av alle modeller vi har testet, og toppet Claude Haiku med 4,5 (25 %) ➤ Toppscore for instruksjonsoppfølging og rask overholdelse. På IFBench tar Grok 4.20 #1-plassen med 82,9 % – en +29,2 poengs økning på Grok 4 ➤ Ledende hastighet for sin intelligens. Med 265 tokens per sekund i utgangshastighet på xAIs API, er Grok 4.20 betydelig raskere enn sin jevnaldrende og over dobbelt så høy utgangshastighet som sett fra Grok 4.1 Fast Gratulerer til @xai og @elonmusk med lanseringen av 4.20 Beta 0309!
Ytterligere analyse om kunstig analyse:
31,93K