La beta 4.20 di Grok mostra tre miglioramenti principali rispetto a Grok 4: ➤ Il nostro tasso di allucinazione più basso di sempre nella valutazione AA-Omniscience. Quando Grok non conosceva la risposta, ha allucinato una risposta errata il 22% delle volte - questo è il tasso di allucinazione più basso di qualsiasi modello abbiamo testato, superando Claude Haiku 4.5 (25%) ➤ Punteggi massimi per il rispetto delle istruzioni e l'aderenza ai prompt. Su IFBench, Grok 4.20 occupa il primo posto con l'82,9% - un aumento di +29,2 punti rispetto a Grok 4 ➤ Velocità leader per la sua intelligenza. Con una velocità di output di 265 token al secondo sull'API di xAI, Grok 4.20 è significativamente più veloce dei suoi pari e oltre 2 volte la velocità di output vista con Grok 4.1 Fast Congratulazioni a @xai e @elonmusk per il lancio della beta 4.20 0309!
Ulteriore analisi su Analisi Artificiale:
31,93K