Beta Grok 4.20 arată trei îmbunătățiri majore față de Grok 4: ➤ Cea mai mică rată de halucinații din istoria noastră la evaluarea AA-Omniscience. Când Grok nu știa răspunsul, a halucinat un răspuns greșit în 22% din cazuri – aceasta este cea mai scăzută rată de halucinații dintre toate modelele pe care le-am testat, depășind Claude Haiku cu 4,5% (25%) ➤ Cele mai bune scoruri pentru urmarea instrucțiunilor și respectarea promptă. Pe IFBench, Grok 4.20 ocupă poziția #1 cu 82.9% - o creștere de +29.2 puncte față de Grok 4 ➤ Viteză de avans pentru inteligența sa. Cu o viteză de ieșire de 265 tokens pe secundă pe API-ul xAI, Grok 4.20 este semnificativ mai rapid decât omologul său și de peste două ori mai rapid decât Grok 4.1 Fast Felicitări lui @xai și @elonmusk pentru lansarea Beta 4.20 0309!
Analiză suplimentară a analizei artificiale:
31,93K