Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Mai multe dovezi LLM-uri nu sunt conștiente și nu generalizează nicio informație și, prin urmare, nu vor deveni în general inteligente, ci sunt de fapt (încă extrem de utile) respondenți statistici instruiți.

19 mar., 22:14
🚨 Șocant: LLM-urile Frontier obțin un scor de 85-95% la benchmark-urile standard de programare. Le-am dat probleme echivalente în limbi pe care nu le-ar fi putut memora. S-au prăbușit la 0-11%.
Vă prezint EsoLang-Bench.
Acceptat la atelierele de Raționament Logic și ICBINB la ICLR 2026 🧵
Absolvenții de informatică primesc provocări de programare în limbaje pe care nu le-au mai văzut + cu doar puțină sintaxă și li se cere să facă lucruri precum să codeze o secvență Fibonacci pentru a demonstra că nu repetă pur și simplu
Și asta exclude oamenii, dar nu 90%
58
Limită superioară
Clasament
Favorite
