Cercetarea automată a evaluării memoriei pentru un agent PI personalizat, framework FOARTE interesant până acum De asemenea, testez această abilitate de cod claude /autoresearch (link în răspunsuri) Se pare că transformă agenții într-un pipeline complet de cercetători auto Îl evaluez în funcție de seturi de date reale de memorie cu rulări de agenți reali, specific în funcție de cât de bine pot reține o bază de cod va raporta rezultatele
OK, CLAUDE BOI !!
este atât de tare
891