🚨 AutoBench 1.0 – Run 4 está AO VIVO 📷 - 33 modelos de fronteira classificados (incluindo GPT-5.1, Gemini 3 Pro, Grok 4.1, Kimi K2 Thinking, etc.) - 21 modelos de classificação - Mais de 300 perguntas novas geradas - Mais de 220.000 classificações individuais Esta é a avaliação mais resistente a manipulações que já realizamos. E sim… o vencedor NÃO é quem a maioria das pessoas esperava. 1/13