🚨 AutoBench 1.0 – 4. Koşu CANLI 📷 - 33 öncü model sıralandı (GPT-5.1, Gemini 3 Pro, Grok 4.1, Kimi K2 Thinking vb. dahil) - 21 Sıralama modelleri - 300+ yeni soru oluşturuldu - 220.000+ bireysel sıralama Bu, şimdiye kadar yürüttüğümüz en manipülasyona karşı dirençli değerlendirme. Ve evet... kazanan, çoğu insanın beklediği kişi DEĞİL. 1/13