Recent, @supermemory obținut 99% pe LongMemEval. Problema este că benchmark-urile de memorie au fost create când LLM-urile aveau o fereastră de context foarte mică. De exemplu, LongMemEval_M este de ~1,5 milioane de jetoane. Care este aproape în interiorul ferestrei de context Opus 4.6. Din ce am înțeles, cel mai bun benchmark actual este BEAM cu fereastră de context de 10M. Așa că evaluez toate sistemele noi de memorie pe baza scorului lor acolo. Sunt nerăbdător să văd cum va @supermemory scorul! Sunt sigur că va merge bine!