Beta verze Grok 4.20 ukazuje tři hlavní vylepšení oproti Grok 4: ➤ Naše nejnižší míra halucinací v historii v hodnocení AA-Vševědoucnost. Když Grok neznal odpověď, halucinoval nesprávnou odpověď ve 22 % případů – to je nejnižší míra halucinací ze všech modelů, které jsme testovali, překonávající Claude Haiku 4,5 (25 %) ➤ Nejlepší skóre za dodržování instrukcí a rychlé dodržování předpisů. Na IFBench je Grok 4.20 na #1 s 82,9 % – což je +29,2 bodu více než Grok 4 ➤ Vedoucí rychlost díky své inteligenci. Při výstupní rychlosti 265 tokenů za sekundu na API xAI je Grok 4.20 výrazně rychlejší než jeho konkurent a více než dvojnásobek výstupní rychlosti oproti Grok 4.1 Fast Gratulujeme @xai a @elonmusk k uvedení Beta 0309 4.20!
Další analýza umělé analýzy:
31,89K