Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Więcej dowodów na to, że LLM-y nie są świadome i nie generalizują żadnych informacji, a zatem nie staną się ogólnie inteligentne, lecz w rzeczywistości są (wciąż niezwykle użyteczne) wytrenowanymi statystycznymi responderami.

19 mar, 22:14
🚨 Szokujące: LLM-y Frontier osiągają wyniki 85-95% w standardowych testach kodowania. Daliśmy im równoważne problemy w językach, których nie mogły zapamiętać. Zawiodły, osiągając 0-11%.
Prezentujemy EsoLang-Bench.
Zaakceptowane na warsztatach dotyczących rozumowania logicznego i ICBINB na ICLR 2026 🧵
Absolwenci informatyki dostają wyzwania programistyczne w językach, których wcześniej nie widzieli + zaledwie z odrobiną składni i są proszeni o zrobienie rzeczy, takich jak zakodowanie ciągu Fibonacciego, aby udowodnić, że nie tylko powtarzają, cały czas
I to rzeczywiście wyklucza niektórych ludzi, ale nie 90%.
52
Najlepsze
Ranking
Ulubione
