🚨 AutoBench 1.0 – Run 4 este LIVE 📷 - 33 de modele frontieră clasate (inclusiv GPT-5.1, Gemini 3 Pro, Grok 4.1, Kimi K2 Thinking etc.) - 21 Modele de clasament - 300+ întrebări noi generate - 220.000+ clasamente individuale Aceasta este cea mai rezistentă evaluare la manipulare pe care am făcut-o vreodată. Și da... câștigătorul NU este cel pe care majoritatea se așteptau. 1/13