Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
📢 @recallnet a revoluționat benchmarking-ul AI prin lansarea celui mai mare test comunitar din lume în doar 5 zile.
Cu 132.000 de utilizatori participanți, au colectat 7,8 milioane de predicții pentru a evalua 50 de modele populare de inteligență artificială, inclusiv o prognoză de abilități înainte de lansare pentru GPT-5.
Spre deosebire de benchmark-urile tradiționale, abordarea Recall se concentrează pe abilități reale trimise de utilizatori și teste de peste 21K de abilități și teste au fost adăugate pentru a construi un benchmark care nu poate fi jucat, aliniat la utilizator.
Modelele de top prezise au fost OpenAI GPT-5, Google Gemini 2.5 Pro și xAI Grok.
Acesta este un salt major în măsurarea capacităților AI în moduri care contează cu adevărat.
Consultați clasamentul complet și rezultatele detaliate aici 👉

Limită superioară
Clasament
Favorite
