Grok 4.20 Beta menunjukkan tiga peningkatan besar dibandingkan Grok 4: ➤ Tingkat halusinasi terendah kami pada evaluasi AA-Omniscience. Ketika Grok tidak tahu jawabannya, ia berhalusinasi jawaban yang salah 22% dari waktu - ini adalah tingkat halusinasi terendah dari model mana pun yang telah kami uji, melampaui Claude Haiku 4,5 (25%) ➤ Skor tertinggi untuk mengikuti instruksi dan kepatuhan yang cepat. Di IFBench, Grok 4.20 menempati posisi #1 dengan 82.9% - peningkatan +29.2 poin pada Grok 4 ➤ Kecepatan terdepan untuk kecerdasannya. Dengan kecepatan keluaran 265 token per detik pada API xAI, Grok 4.20 secara signifikan lebih cepat daripada rekannya dan lebih dari 2x kecepatan keluaran yang terlihat dari Grok 4.1 Fast Selamat kepada @xai dan @elonmusk atas peluncuran 4.20 Beta 0309!
Analisis lebih lanjut tentang Analisis Buatan:
31,93K