Eğer bu doğruysa, Gemini 3 pişmiş demektir. Grok 4 ve Grok 4.1 (tahmini) puanlarıyla hızlı bir tablo yaptım. Şimdi neden Grok'u dahil etmediklerini anlıyorsunuz. Grok 4, çoğu benchmark'ta ya üstün ya da eşdeğer sonuçlar aldı. Ve Grok 4.1 sonuçları henüz çıkmadı.