🚨 AutoBench 1.0 – Run 4 está DISPONÍVEL 📷 - 33 modelos de fronteira classificados (incluindo GPT-5.1, Gemini 3 Pro, Grok 4.1, Kimi K2 Thinking, etc.) - 21 Modelos de classificação - 300+ perguntas novas geradas - 220.000+ rankings individuais Esta é a avaliação mais resistente à manipulação que já fizemos. E sim... o vencedor NÃO é quem a maioria das pessoas esperava. 1/13