DApp Store | Hub Web3 pentru evenimente și jocuri

Subiecte populare

Recent, @supermemory obținut 99% pe LongMemEval. Problema este că benchmark-urile de memorie au fost create când LLM-urile aveau o fereastră de context foarte mică. De exemplu, LongMemEval_M este de ~1,5 milioane de jetoane. Care este aproape în interiorul ferestrei de context Opus 4.6. Din ce am înțeles, cel mai bun benchmark actual este BEAM cu fereastră de context de 10M. Așa că evaluez toate sistemele noi de memorie pe baza scorului lor acolo. Sunt nerăbdător să văd cum va @supermemory scorul! Sunt sigur că va merge bine!

Limită superioară

Clasament

Favorite