xAI, hızlı, ucuz ve ajanik odaklı modelini Grok 4.1 Hızlı'ya yükseltti, Yapay Analiz Zeka Endeksi'nde +4 puan atladı Önemli çıkarımlar: ➤ Lider ajanik performans: Grok 4.1 Fast with Reasoning, τ²-Bench Telecom Liderlik Tablomuzda %93,3 puanla birinci sırayı aldı, Kimi K2 Thinking'in hemen önünde ve Grok 4 Fast'a göre +27 puan artışı temsil ediyor ➤ Intelligence Pareto sınırı: Selefi gibi, Grok 4.1 Fast da düşük maliyetle lider istihbarat sunuyor - Intelligence Index'te Grok 4'ün sadece 1 puan gerisinde yer alıyor ve token başına ~30 kat daha düşük maliyetle yer alıyor. Bu da Grok 4.1 Fast'ı, Zeka Endeks ile maliyet karşılaştırmamızın en çekici dörtlüğe sağlam bir şekilde yerleştirir ➤ Net kademeli yükseltme: Ajanlar ve araç çağrısı için yapılan bu iyileştirmelerin yanı sıra, Grok 4.1 Fast selefinin güçlü yönlerini korur: düşük fiyatlandırma (0,2 dolar/0,5 milyon token giriş/çıktı), geniş bağlam penceresi (2 milyon token) ve token verimliliği @xai ekibini ve @elonmusk bu yeni çıkış için tebrikler! Daha fazla analiz için aşağıya bakınız
Grok 4.1 Fast, Yapay Analiz Zeka Endeksi'nde 64 puan alıyor, bu da Grok 4'ten 4 puan daha yüksek olup, selefine göre açık bir yükseltme yapıyor
Grok 4.1 Fast, Yapay Analiz Zeka Endeksi değerlendirmelerini tamamlamak için 71 milyon token aldı ve 45$ maliyetle, Grok 4'e benzer ve her iki hesapta da diğer çoğu önde gelen modelden çok daha ucuzdu
Bireysel kıyaslama sonuçları: MMLU-Pro, GPQA Diamond, Humanity's Last Exam, LiveCodeBench, SciCode, AIME 2025, IFBench, AA-LCR, Terminal-Bench Hard, τ²-Bench Telecom
Grok 4.1 Fast'ın performansı, maliyeti ve yeteneklerinin daha fazla analizi için modeller sayfamıza bakabilirsiniz
55,81K