Grok 4.20 Beta pokazuje trzy główne ulepszenia w porównaniu do Grok 4: ➤ Nasza najniższa w historii stopa halucynacji w ocenie AA-Omniscience. Gdy Grok nie znał odpowiedzi, halucynował błędną odpowiedź w 22% przypadków - to najniższa stopa halucynacji spośród wszystkich modeli, które testowaliśmy, przewyższająca Claude Haiku 4.5 (25%) ➤ Najwyższe wyniki w zakresie przestrzegania instrukcji i zgodności z podpowiedziami. Na IFBench, Grok 4.20 zajmuje 1. miejsce z wynikiem 82,9% - wzrost o 29,2 punktu w porównaniu do Grok 4 ➤ Wiodąca prędkość w zakresie swojej inteligencji. Przy prędkości wyjściowej 265 tokenów na sekundę w API xAI, Grok 4.20 jest znacznie szybszy niż jego rówieśnicy i ponad 2 razy szybszy niż prędkość wyjściowa z Grok 4.1 Fast Gratulacje dla @xai i @elonmusk z okazji uruchomienia 4.20 Beta 0309!
Dalsza analiza na temat Analizy Sztucznej:
31,93K