Beta Grok 4.20 демонструє три основні покращення порівняно з Grok 4: ➤ Наш найнижчий рівень галюцинацій за оцінкою AA-Omniscience. Коли Grok не знав відповіді, він галюцинував неправильну відповідь у 22% випадків — це найнижчий рівень галюцинацій серед усіх моделей, які ми тестували, перевищуючи Claude Haiku 4,5% (25%) ➤ Найвищі бали за виконання інструкцій та своєчасне дотримання. На IFBench Grok 4.20 займає #1 з 82.9% — це +29.2 пункти зростання порівняно з Grok 4 ➤ Лідирує за інтелектом. При швидкості виводу 265 токенів на секунду в API xAI, Grok 4.20 значно швидший за свого аналога і більш ніж у 2 рази перевищує швидкість виводу, ніж у Grok 4.1 Fast Вітаємо @xai та @elonmusk з виходом 4.20 Beta 0309!
Подальший аналіз на тему штучного аналізу:
31,99K