Die Grok 4.20 Beta zeigt drei wesentliche Verbesserungen gegenüber Grok 4: ➤ Unsere bisher niedrigste Halluzinationsrate bei der AA-Omniscience-Bewertung. Als Grok die Antwort nicht wusste, halluzinierte es in 22 % der Fälle eine falsche Antwort - dies ist die niedrigste Halluzinationsrate aller getesteten Modelle und übertrifft Claude Haiku 4.5 (25 %). ➤ Höchste Punktzahlen für die Befolgung von Anweisungen und die Einhaltung von Aufforderungen. Auf IFBench belegt Grok 4.20 den 1. Platz mit 82,9 % - ein Anstieg um 29,2 Punkte im Vergleich zu Grok 4. ➤ Führende Geschwindigkeit für seine Intelligenz. Mit einer Ausgabegeschwindigkeit von 265 Tokens pro Sekunde über die API von xAI ist Grok 4.20 deutlich schneller als seine Mitbewerber und über 2x schneller als die Ausgabegeschwindigkeit von Grok 4.1 Fast. Herzlichen Glückwunsch an @xai und @elonmusk zum Launch der 4.20 Beta 0309!
Weitere Analysen zur Künstlichen Analyse:
31,92K