Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Recent, @supermemory obținut 99% pe LongMemEval.
Problema este că benchmark-urile de memorie au fost create când LLM-urile aveau o fereastră de context foarte mică.
De exemplu, LongMemEval_M este de ~1,5 milioane de jetoane.
Care este aproape în interiorul ferestrei de context Opus 4.6.
Din ce am înțeles, cel mai bun benchmark actual este BEAM cu fereastră de context de 10M. Așa că evaluez toate sistemele noi de memorie pe baza scorului lor acolo.
Sunt nerăbdător să văd cum va @supermemory scorul! Sunt sigur că va merge bine!

Limită superioară
Clasament
Favorite
