🚨 AutoBench 1.0 – Chạy 4 đang TRỰC TIẾP 📷 - 33 mô hình tiên phong được xếp hạng (bao gồm GPT-5.1, Gemini 3 Pro, Grok 4.1, Kimi K2 Thinking, v.v.) - 21 mô hình xếp hạng - Hơn 300 câu hỏi mới được tạo ra - Hơn 220.000 xếp hạng cá nhân Đây là đánh giá chống thao túng tốt nhất mà chúng tôi từng thực hiện. Và đúng vậy… người chiến thắng không phải là người mà hầu hết mọi người mong đợi. 1/13